您当前的位置：首页 > 电脑百科 > 软件技术 > 软件技术

Selenium自动化程序被检测为爬虫，怎么屏蔽和绕过

时间：2022-04-06 09:45:11 来源：掘金作者：程序那点事

+ 加入收藏

Selenium 操作被屏蔽

使用selenium自动化网页时，有一定的概率会被目标网站识别，一旦被检测到，目标网站会拦截该客户端做出的网页操作。

比如淘宝和大众点评的登录页，当打开浏览器，输入用户名和密码时，是能正常进入首页的，但是如果是通过selenium打开，会直接提示验证失败，点击框体重试。

本文介绍一种办法，不需要修改浏览器属性，不需要注入JAVAScript脚本，也能轻松绕过网站检测。

Selenium为何会被检测

每一个浏览器访问网站时，都会带上特定的指纹特征，网站会解析这些特征，从而判断这次访问是不是自动化程序。

一个最广为人知的特征是
window.navigator.webdriver，该特征直接标明此浏览器是webdriver程序。当一个浏览器通过selenium启动后，在开发者工具中输入这个属性，会发现被标为 true，而手工打开的浏览器是 false。

实际上，浏览器被检测为webdriver程序的特征并不止这一个，这意味着，就算你通过修改属性，也不一定能绕过网站的检测。

我们可以通过 sannysoft 来检测浏览器指纹，如果浏览器是通过selenium等自动化程序打开的，访问这个网址后会有很多特征暴露这些指纹，这些特征的值和手工打开后的值是不一样的，因此可以很轻易被别人检测出来。

有人也试图不用selenium，换成puppeter和playwright这样的自动化工具，但是结局都是一样的。

Selenium避免被检测方法

浏览器在启动时就会带上指纹特征，如果使用自动化程序启动时已经被标记，那为什么不直接用手工启动，然后用Selenium连接已经启动的浏览器呢？

那手工打开浏览器要做什么操作才能让Selenium连接呢？Selenium又是怎样连接手工打开的浏览器呢？

我在 Selenium连接已存在的浏览器1 这篇文章详细记录了需要的步骤，概括起来：

1、打开浏览器时添加以下参数：

--remote-debugging-port=9222 --user-data-dir="C:\selenium\ChromeProfile"

2、selenium中设置浏览器选项，通过上面设置的 9222端口连接浏览器：

from selenium.webdriver.chrome.options import Options

chrome_options = Options()
chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")
driver = webdriver.Chrome(options=chrome_options)

通过 subprocess 运行浏览器

当然，做自动化程序一般不会手工点击图标来打开浏览器，我们可以用命令行启动浏览器，然后再用 selenium 连接。

import subprocess
cmd = '"C:\Program Files (x86)\google\Chrome\Application\chrome.exe" ' \
'--remote-debugging-port=9222 ' \
'--user-data-dir="C:\selenium\ChromeProfile"'

subprocess.run(cmd)

我是九柄，感谢耐心阅读，下次见。

作者：九柄
链接：
https://juejin.cn/post/7083138870962814989

Tags：Selenium 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

Python Selenium实现自动化测试及Chrome驱动使用！

本文将介绍如何使用Python Selenium库实现自动化测试，并详细记录了Chrome驱动的使用方法。通过本文的指导，读者将能够快速上手使用Python Selenium进行自动化测试。并了解如何...【详细内容】

2023-12-25　　Search: Selenium 点击:(135)　　评论:(0)　　加入收藏

什么是Selenium：Web自动化测试工具，提高你的工作效率

什么是Selenium01模拟浏览器：Selenium我们知道，网页会使用Java加载数据，对应于这种模式，可以通过分析数据接口来进行直接抓取，这种方式需要对网页的内容、格式和Java代码有所研究...【详细内容】

2023-09-11　　Search: Selenium 点击:(249)　　评论:(0)　　加入收藏

使用python selenium模拟登陆163并发送邮件

1、思路1.使用selenium登陆163邮箱2.自动发送邮件到qq邮箱2、完整代码from selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsf...【详细内容】

2022-11-21　　Search: Selenium 点击:(390)　　评论:(0)　　加入收藏

python + selenium实现gitlab全文搜索

一般来说软件开发相关企业都会有自己内部的源代码管理工具，比如私有部署的gitlab服务器。特别是企业上规模之后会有多个产品线，各个业务产品线各自的项目解决方案会非常多。以...【详细内容】

2022-11-16　　Search: Selenium 点击:(293)　　评论:(0)　　加入收藏

python+selenium自动化测试框架详解，我就讲一遍

前言本文整理归纳以往的工作中用到的东西，现汇总成基础测试框架提供分享。框架采用python3 + selenium3 + PO + yaml + ddt + unittest等技术编写成基础测试框架，能适应日常测...【详细内容】

2022-08-22　　Search: Selenium 点击:(381)　　评论:(0)　　加入收藏

Selenium自动化测试网页加载太慢怎么办

遇到网页加载慢，selenium运行效率降低，可以通过修改页面加载策略提升自动化效率。selenium加载很慢通过URL导航到新页面时，默认情况下，Selenium将等待文档完全被加载才会执行下...【详细内容】

2022-07-30　　Search: Selenium 点击:(955)　　评论:(0)　　加入收藏

楼下老大爷都能看懂的python3+selenium自动化测试框架

首先你得知道什么是Selenium？ Selenium是一个基于浏览器的自动化测试工具，它提供了一种跨平台、跨浏览器的端到端的web自动化解决方案。Selenium主要包括三部分：Selenium IDE、...【详细内容】

2022-05-10　　Search: Selenium 点击:(289)　　评论:(0)　　加入收藏

Selenium自动化程序被检测为爬虫，怎么屏蔽和绕过

Selenium 操作被屏蔽使用selenium自动化网页时，有一定的概率会被目标网站识别，一旦被检测到，目标网站会拦截该客户端做出的网页操作。比如淘宝和大众点评的登录页，当打开浏览器，...【详细内容】

2022-04-06　　Search: Selenium 点击:(360)　　评论:(0)　　加入收藏

python网络爬虫基于selenium爬取斗鱼直播信息

前言目前是直播行业的一个爆发期，由于国家对直播行业进行整顿和规范，现在整个直播行业也在稳固发展。随着互联网和网络直播市场的快速发展，相信未来还有广阔的发展前景。今天用...【详细内容】

2022-03-15　　Search: Selenium 点击:(293)　　评论:(0)　　加入收藏

学selenium前，如何下载谷歌浏览器webdriver驱动

第一步：pip install selenium 第二步：查看自己的谷歌浏览器版本第三步：浏览器输入chromedriver mirror，查找与自己谷歌浏览器版本最相近的压缩包，但不能超过该版本。因为...【详细内容】

2022-02-08　　Search: Selenium 点击:(537)　　评论:(0)　　加入收藏

▌简易百科推荐

如何在Windows 10中查看电脑的名称？这里提供详细步骤

你想在有多台计算机组成的网络上查找你的计算机吗？一种方法是找到你的电脑名称，然后在网络上匹配该名称。下面是如何在Windows 10中使用图形和命令行方法查看你的计算机名称。...【详细内容】

2024-04-10　　驾驭信息纵横科技　　　　Tags:Windows 10 　点击:(6)　　评论:(0)　　加入收藏

移动版 Outlook 解锁新技能，可验证登录 OneDrive 等微软服务

IT之家 4 月 9 日消息，微软公司近日发布新闻稿，宣布用户可以使用 Outlook 手机应用，轻松登录 Teams、OneDrive、Microsoft 365 以及 Windows 等微软账号服务。移动端 Outlook...【详细内容】

2024-04-09　　　　IT之家　　Tags:Outlook 　点击:(7)　　评论:(0)　　加入收藏

Win10/Win11和 macOS用户反馈：谷歌云服务“捆绑”系统 DNS 设置

IT之家 4 月 6 日消息，谷歌公司承认旗下的 Google One 订阅服务中存在问题，在 Windows 10、Windows 11 以及 macOS 系统上会更改系统 DNS 设置，变更为 8.8.8.8 地址。Google On...【详细内容】

2024-04-08　　　　IT之家　　Tags:Win10 　点击:(11)　　评论:(0)　　加入收藏

电脑卡顿怎么重装系统，快看这篇

电脑卡顿时，重装系统确实是一种可能的解决方案。以下是重装系统的详细步骤：备份重要数据：首先，你需要将电脑中的重要文件和数据备份到外部存储设备（如U盘、移动硬盘或云存储）中，以...【详细内容】

2024-04-04　　科技数码前锋　　　　Tags:重装系统　点击:(5)　　评论:(0)　　加入收藏

如何检查电脑的最近历史记录？这里提供详细步骤

如果你怀疑有人在使用你的计算机，并且你想查看他们在做什么，下面是如何查看是否有访问内容的痕迹。如何检查我的计算机的最近历史记录要检查计算机的最近历史记录，应该从web浏...【详细内容】

2024-03-30　　驾驭信息纵横科技　　　　Tags:历史记录　点击:(6)　　评论:(0)　　加入收藏

关于Windows中AppData的相关知识，看这篇文章就可以了

如果AppData文件夹占用了你电脑上的太多空间，则需要清理AppData文件夹。下面是一些帮助你在Windows计算机上进行AppData清理的方法。什么是AppData文件夹AppData文件夹是保存...【详细内容】

2024-03-30　　驾驭信息纵横科技　　　　Tags:AppData 　点击:(10)　　评论:(0)　　加入收藏

微软 Edge 浏览器将迎来“内存限制器”功能，用户可自主控制 Edge 内存占用

IT之家 3 月 28 日消息，微软即将为其 Edge 浏览器带来一项实用新功能，据悉该公司正在测试一项内置的内存限制器，这项功能可以让用户限制 Edge 所占用的内存，防止浏览器超出内存...【详细内容】

2024-03-29　　　　IT之家　　Tags:Edge 　点击:(21)　　评论:(0)　　加入收藏

一寸照片的大小如何压缩？四个实测效果很好的方法

一寸照片作为生活中常见的尺寸之一，常用于各类证件照与证明文件的制作。然而，受限于其较为狭小的尺寸，上传及打印过程中很容易出现尺寸超限的情况。所以，这个时候就需要对其体积...【详细内容】

2024-03-18　　宠物小阿涛　　　　Tags:压缩　点击:(20)　　评论:(0)　　加入收藏

手机投屏到电脑/电视的方法

方法一：Win10自带的投影功能1、将手机和电脑连接同一个无线网络。2、选择【开始】>【设置】>【系统】>【投影到此电脑】3、将默认的始终关闭的选项更改为所有位置都可用。4、...【详细内容】

2024-03-18　　　　老吴讲I　　Tags:投屏　点击:(24)　　评论:(0)　　加入收藏

微软商店怎么卸载应用一分钟快速看懂！

微软商店怎么卸载应用一分钟快速看懂！微软公司（Microsoft Corporation）是一家全球领先的科技企业，总部位于美国华盛顿州的雷德蒙德。成立于1975年，由比尔·盖茨和保罗&mid...【详细内容】

2024-02-27　　婷婷说体育　　　　Tags:微软商店　点击:(44)　　评论:(0)　　加入收藏

推荐资讯

凌晨3点北京鬼市，天亮	老美怂了？美国众议院计
Meta AI 全球市场扩张	重磅！Meta推出开源大模
多地将禁止超标车上路	喝完一瓶啤酒，多久才能
古代富人都喜欢“扬州	夫妻一方可查询配偶财