爬虫--文案网--不烂大街的救赎文案精选-摩杜云开发者社区

爬虫--文案网--不烂大街的救赎文案精选

WIU1Qlm7CwPb 2023年11月02日 69 0

属性值属性值 html html windows windows

简单的爬取一个网站

文案网--不烂大街的救赎文案精选

获取文案

效果：

爬虫--文案网--不烂大街的救赎文案精选_html

爬虫--文案网--不烂大街的救赎文案精选_Windows_02

网站地址：

https://www.wenanwang.com/lz/1764.html

内容就放在源文件当中

所以比较简单

直接访问

url = 'https://www.wenanwang.com/lz/1764.html'


headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 5.1; U; en; rv:1.8.1) Gecko/20061208 Firefox/2.0.0 Opera 9.50'
}
# 访问
res = requests.get(url=url,headers=headers)

拿到源代码之后

用bs4解析提取

bs4解析方法就是通过标签名和属性值来定位的

意思是：定位到第一个标签为div，class属性值为content 的所有的p标签

lis = soup.find_all('div',class_='content')[0].find_all_next('p')

soup = BeautifulSoup(text,'html.parser')
# 提取所有的文案
lis = soup.find_all('div',class_='content')[0].find_all_next('p')

返回一个列表

循环打印

# 逐个打印
for li in lis:
    print(li.text)

看效果

爬虫--文案网--不烂大街的救赎文案精选_html

以下是完整代码

import requests
from bs4 import BeautifulSoup








url = 'https://www.wenanwang.com/lz/1764.html'


headers = {
    'user-agent':'Mozilla/5.0 (Windows NT 5.1; U; en; rv:1.8.1) Gecko/20061208 Firefox/2.0.0 Opera 9.50'
}
# 访问
res = requests.get(url=url,headers=headers)
# 设置编码
res.encoding='utf8'
text = res.text
# 使用bs4解析
soup = BeautifulSoup(text,'html.parser')
# 提取所有的文案
lis = soup.find_all('div','content')[0].find_all_next('p')
# 逐个打印
for li in lis:
    print(li.text)

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：爬取dangdang网书籍全部信息下一篇： python爬虫--下载虎牙视频--舞蹈区视频

分享：

最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读

JQuery使用技巧（一）处理URL

iFlC2TQwmEmX 2023年12月23日 106 0 0 html url jQuery html jQuery url

记录 | xftp远程连接两台windows

HRODlxSsrDy9 2023年12月23日 177 0 0 两台windows 客户端 xftp Windows xftp 客户端 windows 两台windows

jquery加载html代码到div

SuVXIKXQi51s 2023年12月23日 28 0 0 html jQuery 加载 html 加载 jQuery

jquery鼠标双击事件

F5MM6ELZe4VV 2023年12月23日 31 0 0 html 双击事件双击事件 jQuery html jQuery

jquery 用新标签跳转页面

Dk8XksB4KnJY 2023年12月23日 42 0 0 html 标签页 jQuery 标签页 html jQuery

第五节JavaScript typeof、类型转换与正则表达式

G5G9kTkvHDi8 2023年12月23日 27 0 0 字符串 html 字符串 html 开发语言正则表达式 javascript JavaScript 开发语言正则表达式

jquery 禁止 a 点击

rvK6MEy2nX9x 2023年12月23日 74 0 0 html 点击事件点击事件 jQuery html jQuery

Python优雅重启谷歌游览器并过cf

wOK1sw0wtkd8 2023年12月23日 84 0 0 App App 开发语言 chrome python windows windows chrome 开发语言 python

jquery 清除focus

QtikZq7rxZYL 2023年12月23日 162 0 0 html 示例代码示例代码 jQuery html jQuery

jquery点击事件切换样式

878tGgGE4gkv 2023年12月23日 121 0 0 html 点击事件点击事件 jQuery html jQuery

jquery移除table某一行

7YynnRRFCsyP 2023年12月23日 56 0 0 前端开发 html 前端开发 jQuery html jQuery

vue一些问题

Y7bRdvZFQlwk 2023年12月23日 57 0 0 属性值属性值优先级数据数据优先级

记录 | windows更换pip源

HRODlxSsrDy9 2023年12月23日 33 0 0 搜索 pip 创建文件夹更换清华源 Windows windows 创建文件夹 pip 更换清华源搜索

jquery 取thymeleaf数据

s2pvW3BZ98qa 2023年12月23日 30 0 0 html 数据 jQuery 数据 html jQuery

jquery div是否有滚动条

XSukm9cU0gkT 2023年12月23日 40 0 0 html 代码示例代码示例 jQuery html jQuery

前端歌谣-第叁拾肆课-ES6模块化开发计算器小案例续

Fuy6dnbn2ffz 2023年12月23日 36 0 0 装饰器模式数据 html 数据 html 装饰器模式

jquery 取最后一个child

vbyzBTPBnJJV 2023年12月23日 33 0 0 html jQuery html jQuery

WIU1Qlm7CwPb

作者其他文章更多

爬虫--中国气象局--全国天气

2023-11-02

爬虫黑科技：如何应对反爬虫机制，成功爬取任何网站"

2023-11-02

python爬虫40行代码一键获取b站视频的全部热门评论

2023-11-02

2023年电影票房王者！学会使用Python轻松抓取猫眼电影网站的票房排行榜数据

2023-11-02

使用Scrapy框架爬取当当网图书信息

2023-11-02

用python查询12306车票，一件获取所有车次信息

2023-11-02

python爬虫--微博评论

2023-11-02

python爬虫-实现快手点赞、评论、关注、下载等完整功能

2023-11-02

python爬虫实战-爬取某丽图库网站的古装小姐姐高清图片壁纸

2023-11-02

python多线程-通过关键词下载百度图片

2023-11-02

最新推荐更多

终于搞懂了！原来 Vue 3 的 generate 是这样生成 render 函数的

2024-05-20

博客园美化：增加顶部炫彩loading进度条

2024-05-20

lodash已死？radash库方法介绍及源码解析 —— 函数柯里化 + Number篇

2024-05-20

TypeScript入门介绍

2024-05-20

XML Schema 复杂元素类型详解：定义及示例解析

2024-05-20

什么是单点登录？如何实现？

2024-05-20

基于uniapp+vue3自定义增强版table表格组件「兼容H5+小程序+App端」

2024-05-18

解释下什么是事件代理？应用场景？

2024-05-18

Vue项目中有封装过axios吗？主要是封装哪方面的？

2024-05-17

浅谈Vue.js与原生开发

2024-05-17

vue要做权限管理该怎么做？如果控制到按钮级别的权限怎么做？

2024-05-17

Vue模板语法、属性绑定、条件渲染的学习

2024-05-17

vue3编译优化之“静态提升”

2024-05-17

VUE-局部使用

2024-05-17

你是怎么处理vue项目中的错误的？

2024-05-17

实现抖音 “视频无限滑动“效果

2024-05-17

说说webpack proxy工作原理？为什么能解决跨域?

2024-05-17

我为什么还要造一个前端轮子？

2024-05-17

一款摸鱼神器！帮助你利用上班时间背单词！

2024-05-17

next-route

2024-05-17