python爬虫爬取视频案例,30行代码教你爬取下载保存梨视频
  WIU1Qlm7CwPb 2023年11月02日 65 0

今天用30行代码爬取下载视频

比较简单啊

关注公众号

公众号回复 梨视频 获取源代码


先看效果

可以正常播放没问题

python爬虫爬取视频案例,30行代码教你爬取下载保存梨视频_公众号


首先打开网站,随便点开一个视频

然后打开开发者模式

开始分析

内容应该是异步传输,所以我们点击网路,点击xhr

然后看到一个文件

里面存放着json格式的数据

全部点开,可以看到一个srcurl

python爬虫爬取视频案例,30行代码教你爬取下载保存梨视频_ide_02


看着像是视频源,但是我们打开它却是404

python爬虫爬取视频案例,30行代码教你爬取下载保存梨视频_ide_03

而真实的视频源地址是

https://video.pearvideo.com/mp4/adshort/20210413/cont-1726352-15654838_adpkg-ad_hd.mp4

python爬虫爬取视频案例,30行代码教你爬取下载保存梨视频_ide_04

# 得到的地址
https://video.pearvideo.com/mp4/adshort/20210413/1681552485961-15654838_adpkg-ad_hd.mp4


# 真实地址
https://video.pearvideo.com/mp4/adshort/20210413/cont-1726352-15654838_adpkg-ad_hd.mp4


发现是把那串数字替换成了cont-1726352
1726352是视频id
直接在视频首页连接获取就可以
1681552485961这串数字在json数据里有
所以到时候直接替换就可以了


开始写代码

# 视频首页链接
url = 'https://www.pearvideo.com/video_1726352'
# 把contid提取出来
contid = url.split('_')[1]
# 这是存放json数据,视频源的链接
videostatusurl = f'https://www.pearvideo.com/videoStatus.jsp?contId={contid}&mrd=0.8703028188715882'


headers = {
    'Referer': url,
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/112.0.0.0 Safari/537.36 Edg/112.0.1722.39',
}
# 开始访问
response = requests.get(url=videostatusurl,headers=headers)
json_data = response.json()


开始访问,获取数据,提取数据

把systemTime提取出来

因为需要把这串数字替换成contid

这样就可以得到真是视频地址了

python爬虫爬取视频案例,30行代码教你爬取下载保存梨视频_json数据_05

然后进行替换

srcUrl = srcUrl.replace(systemTime,f"cont-{contid}")
print(srcUrl)


with open('梨视频/1.mp4',mode='wb',)as f:
    f.write(requests.get(srcUrl).content)


print('视频保存完成')


看效果

python爬虫爬取视频案例,30行代码教你爬取下载保存梨视频_ide_06

可以播放

公众号回复 梨视频 获取源代码

感谢观看

欢迎分享



【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
  anLrwkgbyYZS   2023年12月30日   33   0   0 ideciciMaxideMax
WIU1Qlm7CwPb