爬取斗图吧表情包
  WIU1Qlm7CwPb 2023年11月02日 98 0

用python获取斗图吧表清包

微信关注公众号回复 斗图吧 获取源代码

看效果

爬取斗图吧表情包_图吧


打开网站

点击系列表情包

然后随便点击一个

爬取斗图吧表情包_微信_02

然后打开开发者模式

找到该段代码

爬取斗图吧表情包_微信_03

一个是表情包名称

还有一个是src属性

属性值是表情包的url地址

所以先从这个网页中获取表情包的名称和表情包的url地址

然后再进行下载保存

进行访问

注意要加上referer防盗链,因为表情包的地址设置了防盗链,如果不设置,就访问下载不了

url = 'https://www.doutub.com/series_lists/details/p5bdhifn5WEW3JXjDz8ReaED'


    headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36 Edg/111.0.1661.54',
    'referer': 'https://m.doutub.com/'
    }


    response = requests.get(url=url,headers=headers).text


提取信息

img_url = re.findall('<img alt=".*?" src="(.*?)" .*?>',response)
    title = re.findall('<p class="imgText" .*?>(.*?)</p>',response)
    # print(title)


下载保存

for i in img_url[1:]:
        img_name = re.sub(rstr,"", title[a])
        a+=1
        print(i)
        content = requests.get(url=i,headers=headers).content
        with open(f'斗图网/{img_name}.jpg',mode='wb') as f:
            f.write(content)
        print('保存完成!')


微信关注公众号回复 斗图吧 获取源代码


【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
WIU1Qlm7CwPb