2023爬虫学习笔记 -- selenium反爬虫操作(window.navigator.webdriver属性值)

news/2024/7/19 10:54:31 标签: 爬虫, selenium, 反爬虫, python爬虫, 网络爬虫

一、无可视化浏览器操作

1、导入需要的函数,固定写法,并设置相关浏览器参数

from selenium.webdriver.chrome.options import Options


浏览器设置=Options()
浏览器设置.add_argument("--headless")
浏览器设置.add_argument("--disable-gpu")

2、请求的时候加上参数设置

浏览器=webdriver.Chrome(r'./chromedriver',options=浏览器设置)
目标网址=浏览器.get('https://www.XXX.com/')

3、通过截图证明确实被打开了

浏览器.save_screenshot("百度.png")

二、有些网站通过判断window.navigator.webdriver属性值来判断是否有爬虫行为

1、正常访问浏览器,该属性值为false

2、通过webdriver访问浏览器,该属性值为true

三、修改window.navigator.webdriver属性值

1、添加先关的参数,固定写法

浏览器设置=Options()
浏览器设置.add_argument("--disable-blink-features=AutomationControlled")
浏览器设置.add_argument(
    'user-agent=Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36')

2、访问时添加上浏览器设置的参数

浏览器 = webdriver.Chrome('./chromedriver', options=浏览器设置)

3、通过执行JS代码绕过检测机制

with open('绕过.js') as f:
    js = f.read()
浏览器.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
    "source": js
})
浏览器.get('https://www.bXXXu.com')

4、此时检测该属性值为undefined


http://www.niftyadmin.cn/n/155419.html

相关文章

Spring 为什么要三级缓存,二级缓存不行吗?

Spring 设计了三级缓存来解决循环依赖问题。 singletonObjects 一级缓存,用于保存实例化、注入、初始化完成的 bean 实例earlySingletonObjects 二级缓存,用于保存实例化完成、还没依赖注入的 bean 实例singletonFactories 三级缓存,用于保存…

Prometheus AlertManager讲解

一、概述Prometheus 包含一个报警模块,就是我们的 AlertManager,Alertmanager 主要用于接收 Prometheus 发送的告警信息,它支持丰富的告警通知渠道,而且很容易做到告警信息进行去重,降噪,分组等&#xff0c…

LoRa烟雾报警器的安装方式

LoRa烟雾报警器是一种常用的消防安全设备,它能够在发现火灾或烟雾时迅速发出警报,为人们提供及时的警示和保护。但是,烟雾报警器的安装也是非常关键的,只有正确安装才能发挥其最大的作用。以下是烟雾报警器安装的步骤:…

如何在VS中解决查看中文乱码问题。

1 现象 1我们在调试的过程中,总是会遇到中文字符串。但是你用vs自带的工具去看总是乱码,但有的时候又是正常,完全摸不着头脑。比如,看如下代码:int main() {// 乱码const char *chinese "白";// 正常显示co…

面向软件团队的敏捷项目管理工具

敏捷开发模式已经被越来越多的企业认可并执行。项目管理的核心是控制预算,按时交付,同时保证质量。如果想提高管理技能,多多学习,找一些好的网站,有好的文章,比如:scrum中文网,也可以…

【Spring事务】声明式事务 使用详解

个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ 声明式事务一、编程式事务二、声明式事务&…

Structs2学习(五)

一、拦截器的概述: 1、什么是拦截器: 注: 深黄:servlet Filters 浅绿:Structs core 深绿:interceptor 浅黄:Usercreate 二、拦截器入门: 1、编写拦截器类: 2、对…

奇迹MU服务器架设完整教程

MU王国,传说中的王国,拥有巨大的财富,吸引了魔族的入侵,魔族控制了野外的动物,使它们成为怪物,向MU王国发起进攻。王国开始训练自己的军队,无数的勇士诞生,英勇的反击战开始了&#…