上市公司污染排放数据计算（unescape方法的使用）-摩杜云开发者社区

上市公司污染排放数据计算（unescape方法的使用）

lcmAlSHHIVfa 2023年11月02日 57 0

企业上市公司环保污染排放环境污染上市公司环保企业污染排放环境污染

需求：

工作中需要计算上市公司污染排放数据，需要首先利用unescape方法对进行文本分析的数据预处理，html2 = """ My Second Heading

My second paragraph.

"""

html_list = [html1, html2]

for html in html_list: soup = BeautifulSoup(html, 'html.parser') text = soup.get_text() print(text) print('-----')

然后通过with参数进行转换后计算处理，最后利用分类分析法来进行单项计算和归类存储，用于后续的深度数据挖掘。

解决：

from bs4 import BeautifulSoup from html import unescape

html = """ My First & Heading

My first paragraph.

"""soup = BeautifulSoup(html, 'html.parser') text = soup.get_text() text = unescape(text)

print(text)

数据来源：上市公司污染排放数据

上一篇：【创新项目探索】大数据服务omnidata-hive-connector介绍下一篇： CDH hadoop 对比

最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读

地级市绿色专利申请和授权的计算（妙用readlines）

lcmAlSHHIVfa 2023年11月02日 66 0 0 环保绿色创新专利申请环保专利申请绿色专利绿色创新绿色专利地级市地级市

上市公司污染排放数据计算（unescape方法的使用）

lcmAlSHHIVfa 2023年11月02日 58 0 0 企业上市公司环保污染排放环境污染上市公司环保企业污染排放环境污染

气相色谱质谱联用仪GCMS-QP2020性能和设计特点

48AxEUsG6SUc 2023年11月02日 56 0 0 环保设计管理理念数据环保高精度高精度数据设计管理理念

上市公司绿色创新效率数据计算（text mining方法的使用）

lcmAlSHHIVfa 2023年11月02日 39 0 0 上市公司能源消耗能源消耗绿色创新绿色创新污染排放上市公司绿色专利绿色专利污染排放

lcmAlSHHIVfa

作者其他文章更多

上市公司数字基础设施数据计算（MongoDB不等值嵌套应用）

2023-11-02

各省数字贸易指数数据计算（peek获取与next传值的使用）

2023-11-02

上市公司环保投入数据计算（活用row.names参数）

2023-11-02

货币政策不确定性数据计算（python的getline方法）

2023-11-02

地级市绿色专利申请和授权的计算（妙用readlines）

2023-11-02

农业全要素生产率的计算（使用HiveQL分析）

2023-11-02

上市公司绿色创新效率数据计算（text mining方法的使用）

2023-11-02

上市公司污染排放数据计算（unescape方法的使用）

2023-11-02

上市公司绿色专利申请数据计算（requests插件的巧用）

2023-11-02

上市公司碳排放量的计算（分读for循环的应用）

2023-11-02