数据分析
绿色发明 标签描述

需求: 工作中需要计算上市公司绿色专利申请数据,需要从先搜索表单值,然后进行匹配和请求,最后需要分析汇总,用于后续的深度数据挖掘。 解决: python中的三大插件,即requests、Beautifulsoup4、lxml的灵活运用,可直接对表单值进行提取、匹配,并进行统计分析 importrequestsfrombs4importBeautifulSoupdefgetHTMLText(url):try:r=requests.get(url,timeout=30)r.raise_for_status()r.encoding='utf-8'returnr.textexcept:return""...