上市公司污染排放数据计算(unescape方法的使用)
  lcmAlSHHIVfa 2023年11月02日 57 0

需求:

工作中需要计算上市公司污染排放数据,需要首先利用unescape方法对进行文本分析的数据预处理,html2 = """ My Second Heading

My second paragraph.

"""

html_list = [html1, html2]

for html in html_list: soup = BeautifulSoup(html, 'html.parser') text = soup.get_text() print(text) print('-----')


然后通过with参数进行转换后计算处理,最后利用分类分析法来进行单项计算和归类存储,用于后续的深度数据挖掘。


解决:

from bs4 import BeautifulSoup from html import unescape

html = """ My First & Heading

My first paragraph.

"""soup = BeautifulSoup(html, 'html.parser') text = soup.get_text() text = unescape(text)

print(text)

数据来源:上市公司污染排放数据

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

lcmAlSHHIVfa
最新推荐 更多

2024-05-31