python+playwright 学习-72 设置window.navigator.webdriver属性为false 跳过网站反爬检测
  iKXeBmqdRgYF 2023年11月05日 40 0

前言

有些网站有反爬机制,比如用代码启动的浏览器会被检测到,需要人机验证,用脚本去点击或者滑动滑动虽然能滑动,但是会认证失败。

用playwright 和 selenium 启动的浏览器都会用个webdriver 属性。浏览器会根据这个属性判断是否是人工正常操作。

python+playwright 学习-72 设置window.navigator.webdriver属性为false 跳过网站反爬检测_chrome

window.navigator.webdriver属性

人工正常打开的浏览器 window.navigator.webdriver属性 为false

python+playwright 学习-72 设置window.navigator.webdriver属性为false 跳过网站反爬检测_标签页_02

以下是通过playwright 打开的浏览器窗口,查看window.navigator.webdriver属性 为true

python+playwright 学习-72 设置window.navigator.webdriver属性为false 跳过网站反爬检测_chrome_03

跳过反爬检测机制

在启动浏览器时添加以下配置项

args=['--disable-blink-features=AutomationControlled']

示例代码

from playwright.sync_api import sync_playwright


with sync_playwright() as p:
    # 非无痕模式启动
    browser = p.chromium.launch_persistent_context(
        # 指定本机用户缓存地址
        user_data_dir="D:\\chrome_userx\\yoyo",
        # 接收下载事件
        accept_downloads=True,
        # 设置 GUI 模式
        headless=False,
        bypass_csp=True,
        slow_mo=100,
        channel="chrome",
        # 跳过反爬检测
        args=['--disable-blink-features=AutomationControlled']
    )
    page = browser.new_page()  # 打开标签页
    page.goto("http://...../users/login/")

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
iKXeBmqdRgYF