【爬虫日记】-摩杜云开发者社区

【爬虫日记】

zzwpYXrztNx3 2023年11月30日 11 0

爬虫测试

开始学习爬虫所遇到的问题合集：

1.Beautiful Soup类的基本元素

Tag：标签，最基本的信息单位，<>开头 <>结尾

Name:标签的名字，如<p> </p>的名字是'p'，tag.name

Attributes:标签的属性，字典格式，tag.attrs

NavigableString:标签内非属性字符串,tag.string

Comment:标签内字符串注释部分,,尖括号叹号表示注释开始

获取父类标签：tag.parent.name

遍历（获取子节点）,获取第一个ul里面所有子节点

soup = BeautifulSoup(data,'lxml')

t = soup.ul.children

获取子节点

soup = BeautifulSoup(data,'lxml')

t = soup.ul.contents

标签选择器

2.解析方式：

BeautifulSoup(res,"lxml")

BeautifulSoup(res,"parser")

3.获取信息方式：

Beautiful Soup:提供find()和find_all()

3.正则获取

reg = re.search(表达式,msg,匹配方式)

上一篇：探索DevOps文化下一篇：软件测评中心▏软件集成测试和功能测试之间的区别和联系简析

最后一次编辑于 2023年11月30日 0

暂无评论

推荐阅读

混沌演练实践（一）

GlkGUhBxsw3T 2023年11月12日 12 0 0 高可用 JSF 测试重启混沌工程

黄金眼PAAS化数据服务DIFF测试工具的建设实践 | 京东云技术团队

GlkGUhBxsw3T 2023年11月02日 29 0 0 接口调用离线测试字段

怎么学自动化测试

P2QOQZgkIeMU 2023年11月02日 39 0 0 手工测试编程语言接口测试测试

用fiddler抓包工具配合夜神抓手机APP包

ccB6cGAX8a9T 2023年11月13日 27 0 0 爬虫

实用技巧：快速部署 JMeter 集群压测环境

Wn0Qd22d3WN0 2023年11月02日 47 0 0 测试测试计划 jmeter 测试工具压力测试

App自动化测试是怎么实现H5测试的

P2QOQZgkIeMU 2023年11月02日 44 0 0 webview android 测试 Chrome

Apifox 产品更新:自动化测试升级,提高 API 测试效率

fFf0DSl4rEhV 2023年11月19日 53 0 0 程序员后端前端测试自动化测试

高效完成测试任务的测试工具推荐！

5rAE77cjvU2g 2023年11月30日 20 0 0 接口文档用例测试测试工具自动化测试

Python动态属性有什么用

P2QOQZgkIeMU 2023年11月02日 31 0 0 赋值数据测试 python

招聘-写给测试同学的礼包

fTwzMccmKzUM 2023年11月19日 20 0 0 测试新功能手机型号

log4j2同步日志引发的性能问题 | 京东物流技术团队

GlkGUhBxsw3T 2023年11月02日 23 0 0 ci 日志输出测试 log4j2 sed

测试人员面试时常见问题

A1MKN3aCO59N 2023年11月02日 33 0 0 测试人员测试职业发展测试经验

测试用例设计方法六脉神剑——第三剑：倚天屠龙，正交试验冲锋 | 京东物流技术团队

GlkGUhBxsw3T 2023年12月12日 13 0 0 取值正交试验法上传测试测试用例

Python函数默认参数避坑指南

P2QOQZgkIeMU 2023年11月02日 32 0 0 数据测试默认参数 python

ModuleNotFoundError_No_module_named通俗的解释和方法

P2QOQZgkIeMU 2023年11月02日 40 0 0 2d 用例测试 python

【爬虫日记】

zzwpYXrztNx3 2023年11月30日 12 0 0 爬虫测试

WEB自动化如何使用XPATH定位元素的方法

p2QdBCa7ky7t 2023年11月13日 16 0 0 相对路径 Xpath 测试

网页解析库：用爬取网页

P2QOQZgkIeMU 2023年11月02日 51 0 0 HTML css 测试 python

JMeter 随机数生成器指南：使用 Random 和 UUID 算法实现

5rAE77cjvU2g 2023年11月02日 44 0 0 测试随机数字符串 jmeter 测试工具

zzwpYXrztNx3

作者其他文章更多

正则表达式

2023-12-06

python里的re

2023-12-06

【爬虫日记】

2023-11-30