python之selenium访问网站被反爬限制封锁解决方法

在访问某些网站时，seleniumwebdriver开启网页失败，被发现为爬虫，目前我碰到的有效解决方案是：

程序员二黑

969人浏览 · 2025-01-16 20:34:38

程序员二黑 · 2025-01-16 20:34:38 发布

在访问某些网站时，selenium webdriver 开启网页失败，被发现为爬虫，目前我碰到的有效解决方案是：

1、因为selenium在命令行手动开启后的谷歌浏览器加了一些变量值，比如window.navigator.webdriver，在正常的谷歌浏览器是undefined，在selenium打开的谷歌浏览器是True，然后对方服务器就会下发js代码，检测这个变量值给网站，网站判断这个值，为True就是爬虫程序就封锁你的访问，如下图。

实现代码是在请求之前改变一些参数，绕过检测，具体细节可以自己了解下网站检测selenium的原理，需要设置对应其它的值都可以加：

　　# 下面代码本人是基于命令行打开再接管浏览器窗口，
　　from selenium import webdriver
　　options = webdriver.ChromeOptions()
　　
　　# chrome在79版之前用下面两行代码
　　#options.add_experimental_option("excludeSwitches", ["enable-automation"])
　　#options.add_experimental_option('useAutomationExtension', False)
　　
　　# -我是最新谷歌浏览器版本，chrome在79和79版之后用这个，
　　driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
　　 "source": """
　　 Object.defineProperty(navigator, 'webdriver', {
　　 get: () => undefined
　　 })
　　 """
　　})
　　driver.get("这里填写你被反爬网站的链接")

如果我的博客对你有帮助、如果你喜欢我的博客内容，请 “点赞” “评论” “收藏” 一键三连哦！

最后： 下方这份完整的软件测试视频教程已经整理上传完成，需要的朋友们可以自行领取【保证100%免费】

天启AI社区

GitCode 天启AI是一款由 GitCode 团队打造的智能助手，基于先进的LLM（大语言模型）与多智能体 Agent 技术构建，致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话，还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力，真正做到“一句话，让 Al帮你完成复杂任务”。

更多推荐