lxml库的基本使用-etree解析html得到对象的不同方式-0233
  TEZNKK3IfmPf 2023年11月14日 19 0

lxml库的基本使用-etree解析html得到对象的不同方式-0233_解析html

基本使用

lxml库的基本使用-etree解析html得到对象的不同方式-0233_常用操作_02

导入模块生成对象

from lxml import etree

htmlElement= etree.HTML(html代码)  # 得到一个element对象,具有xpath方法

htmlStr = etree.tostring(htmlElement)  # 得到html字符串

eg

lxml库的基本使用-etree解析html得到对象的不同方式-0233_常用操作_03

效果

即使html代码不完整,最终通过tostring得到的字符串,会有一个修复

etree的一些操作

  • 解析html字符串-最常用操作
  • 解析html文件
  • 解析不规范的html文件

lxml库的基本使用-etree解析html得到对象的不同方式-0233_xml_04

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月14日 0

暂无评论

推荐阅读
  TEZNKK3IfmPf   2024年03月30日   49   0   0 htmlhtml5
  TEZNKK3IfmPf   2024年03月22日   105   0   0 html框架
  TEZNKK3IfmPf   2024年04月26日   36   0   0 htmlScala
  TEZNKK3IfmPf   2024年03月29日   49   0   0 htmlhtml5
  TEZNKK3IfmPf   2024年03月29日   89   0   0 htmlhtml5
  TEZNKK3IfmPf   2024年03月22日   95   0   0 htmljava
  TEZNKK3IfmPf   2024年03月29日   52   0   0 htmlhtml5
  TEZNKK3IfmPf   2024年03月29日   53   0   0 htmljQuery
TEZNKK3IfmPf