凑个小热闹：python采集《狂飙》评论-摩杜云开发者社区

凑个小热闹：python采集《狂飙》评论

IU4mmr5gQL4g 2023年11月02日 37 0

Python

2023年首部爆款剧集《狂飙》一度冲上热搜第一，害的我两倍速熬夜看完了。

“是非面前稍不留神，就会步入万丈深渊，唯有坚守信仰，才能守得初心”

面对这么多广大网友的讨论，我也来凑上一个热闹

用python爬取《狂飙》评论数据

代码展示

部分代码展示

import requests
import parsel
# 我还录制了详细讲解的视频，直接在这个裙 708525271 自取，包括完整代码

headers = {
    'Cookie': '数据我都删除了，建议用自己的',
    'Host': '',
    'User-Agent': '',
}
for page in range(0, 4000):
    print(page)
    url = f'https://movie.douban.com/subject/35465232/comments?start={page*20}&limit=20&status=P&sort=new_score'
    response = requests.get(url=url, headers=headers)
    select = parsel.Selector(response.text)
    comments = select.css('.comment-item .comment')
    for comment in comments:
        name = comment.css('.comment-info a::text').get()
        try:
            score_str = comment.css('.comment-info .rating::attr(class)').get()
            score = score_str.replace('0 rating', '').replace('allstar', '')
        except:
            score = 0
        comment_time = comment.css('.comment-info .comment-time::text').get().strip()
        vote_count = comment.css('.comment-vote .votes.vote-count::text').get()
        comment_content = comment.css('.comment-content span::text').get()
        print(name, score, comment_time, vote_count, comment_content)

效果展示

不登录的话，只能采集部分，全部评论需要登录后才能爬取。

浏览器数据容易泄密，我都删掉了，大家自己修改一下。

最后

感谢你观看我的文章~本次航班到这里就结束🛬

希望本篇文章有对你带来帮助 🎉，有学习到一点知识~

躲起来的星星🍥也在努力发光，你也要努力加油（让我们一起努力）

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： #Python #密码管理器无需再记住密码，使用Python实现个人密码管理器下一篇： [列举面向对象中带双下线的特殊方法]

分享：

最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读

js逆向) 某音cookie中的__ac_signature

ILxlT0HtFgJu 2024年05月17日 72 0 0 Python

详解Python 中可视化数据分析工作流程

YqbaJkf98QJO 2024年05月17日 70 0 0 Python

快递查询 API 接口：让物流信息一目了然

Ugrw6b9GgRUv 2024年05月17日 83 0 0 Python

深入理解Django：中间件与信号处理的艺术

YpHJ7ITmccOD 2024年05月17日 56 0 0 Python

Python 潮流周刊#50：我最喜欢的 Python 3.13 新特性！

xCoOpmCw66sN 2024年05月17日 58 0 0 Python

Django性能之道：缓存应用与优化实战

YpHJ7ITmccOD 2024年05月17日 67 0 0 Python

Django 静态文件管理与部署指南

YpHJ7ITmccOD 2024年05月17日 63 0 0 Python

一篇文章掌握Python中多种表达式的使用：算术表达式、字符串表达式、列表推导式、字典推导式、_集合推导式、_生成器表达式、逻辑表达式、函数调用表达式

FDs7GVd6cZcT 2024年05月17日 74 0 0 Python

DrissionPage自动化框架学习

2Fnpj8K6xSCR 2024年05月17日 107 0 0 Python

Python字符串方法：字符串查找、替换、分割

FDs7GVd6cZcT 2024年05月17日 69 0 0 Python

高精度数学计算的瑞士军刀，mpmath库详解与应用示例

oaRbYQvpZaaT 2024年05月17日 57 0 0 Python

python中小数据池和编码

xKQN3Agd2ZMK 2024年05月17日 75 0 0 Python

python中7种方法实现字符串的拼接

49iChyeZd8DE 2024年05月17日 62 0 0 Python

Python中私有变量和私有方法

oELtfgAoDdFJ 2024年05月17日 55 0 0 Python

使用python中kivy库生成安卓APP

33Mqsls7cINW 2024年05月17日 65 0 0 Python

探索Django：从项目创建到图片上传的全方位指南

sSh3rBaiME5f 2024年05月17日 36 0 0 Python

运算符与表达式

fwjWaDlWXE4h 2024年05月17日 38 0 0 Python

Django国际化与本地化指南

YpHJ7ITmccOD 2024年05月17日 40 0 0 Python

Django测试与持续集成：从入门到精通

YpHJ7ITmccOD 2024年05月18日 75 0 0 Python

Python 潮流周刊#51：用 Python 绘制美观的图表

xCoOpmCw66sN 2024年05月18日 80 0 0 Python

IU4mmr5gQL4g

作者其他文章更多

Python逆向爬虫入门教程: 千千音乐加密参数 sign 逆向解析

2024-03-29

Python逆向爬虫入门教程: 网易云音乐加密参数 params & encSecKey 逆向解析

2024-03-27

Python逆向爬虫入门教程: 酷狗音乐加密参数signature逆向解析

2024-01-13

用Python写的自动答题脚本，正确率99%，刷课必备

2024-01-12

简单的用Python采集下微博评论，制作可视化词云图

2023-12-28

一个完整Python实战项目：selenium识别验证码实现自动登录，自动操作浏览器获取某东数据

2023-12-27

简单的用Python抓取动态网页数据，实现可视化数据分析

2023-11-25

简单的用Python采集股票数据，保存表格后分析历史数据

2023-11-24

简单的用Python实现一下JS逆向解密，采集空气质量数据

2023-11-19

学妹刚毕业那天，我连夜用Python采集了上万份岗位数据，只为给她找一份好工作

2023-11-06

最新推荐更多

Spring Boot —— 集成 MyBatis-Plus

2024-05-20

keycloak~作为第三方登录的对接标准

2024-05-20

【日记】母亲生日，我在跟数字人民币 Battle（612 字）

2024-05-18

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

2024-05-18

Qt学习第二篇（基本小组件的使用）

2024-05-18

全网首一份！你最需要的PPTP MS-CHAP V2 挑战响应编程模拟计算教程！代码基于RFC2759，附全部源码！

2024-05-18

Python 潮流周刊#51：用 Python 绘制美观的图表

2024-05-18

Django测试与持续集成：从入门到精通

2024-05-18

自研WPF插件系统(沙箱运行及热插拔)

2024-05-18

记一次asp.net 8 服务器爆满的解决过程

2024-05-18

非常全能WinForm 开发框架 - ReaLTaiizor

2024-05-18

C#反射

2024-05-18

net core jwt的基本原理和实现

2024-05-18

VUE3/JAVA 操作系统开发日志[day 1]

2024-05-18

Nginx R31 doc 官方文档-01-nginx 如何安装

2024-05-18

2024 年 5 月 8 日周三晴热（471 字）

2024-05-17

2024 年 5 月 9 日周四阴常（137 字）

2024-05-17

2024 年 5 月 10 日周五阴凉（1025 字）

2024-05-17

lua~基本语法

2024-05-17

2024 年 5 月 12 日母亲节周日晴常（197 字）

2024-05-17