反爬机制

news/2024/7/19 12:37:46 标签: json, 爬虫

robots        防君子不防小人

UA伪装      request 设置headers参数

ajax           动态数据json

图片懒加载  src2/origin

数据加密    js代码里面一些function 加密算法

验证码       云打码/超级鹰12306

cookie       session会话

哈希值       xpath element 里面搜索

# 抓包工具
fiddler
青花瓷
anyproxy
#安卓手机连接fiddler 请看 https://www.cnblogs.com/bobo-zhang/p/10068994.html
网络配置/fiddler证书
基于手机数据一般就是json
https://www.bilibili.com/video/av46090991/?p=10
https://www.jianshu.com/p/7f2be7eed247  爬虫的增量式抓取和数据更新
# requests 的UA
import requests
res = requests.get('https://www.baidu.com')
print(res.request.headers)
#{'User-Agent': 'python-requests/2.21.0', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}

 

转载于:https://www.cnblogs.com/zhangchen-sx/p/10853251.html


http://www.niftyadmin.cn/n/1659995.html

相关文章

Vue——按钮防抖

Vue——按钮防抖 按钮多次点击,只执行点击动作完成的一次事件触发 1.创建utils/once.js文件 export const Debounce (fn, t) > {const delay t || 500let timeoutreturn function () {const context thisconst args argumentsif (!timeout) {timeout set…

链改也是一种供给侧改革 企业上链你准备好了吗?

随着区块链、移动互联网、云计算、人工智能等高新技术的发展,众多传统企业尤其是传统制造业如若不能摆脱低端产业链,就随时会被时代所淘汰。从2015年开始的供给侧改革到今天的链改,传统企业也在经历巨变。 链改就是对传统股份制企业进行区块链…

兼容ie——下载base64pdf格式文件

1.URL转blob dataURLtoBlob (dataurl) {const bstr atob(dataurl)let n bstr.lengthconst u8arr new Uint8Array(n)while (n--) {u8arr[n] bstr.charCodeAt(n)}return new Blob([u8arr], { type: pdf }) // pdf下载// return new Blob([u8arr], { type: application/vnd.m…

[Usaco2008 Nov]Buying Hay 购买干草

题目描述 约翰的干草库存已经告罄,他打算为奶牛们采购H(1≤H≤50000)磅干草,他知道N(1≤N≤100)个干草公司,现在用1到N给它们编号。第i个公司卖的干草包重量为Pi(1≤Pi≤5000)磅,需要的开销为Ci(l≤Ci≤5000)美元.每个干草公司的货源都十分充足,可以卖出无限多的干草…

mysql数据库 --表操作

一、表与表之间建关系 (1) 将所有的数据放在一张表内的弊端 表的组织结构不清晰 浪费存储时间 可扩展性极差 ---> 类似于将所有的代码写入到一个py文件中 -->解耦部分 (2) 如何查找表之间的关系 以员工表和部门表为例:查找表关系需要做到换位思考 (a) 先站在员…

【漫画】分享16张程序员高端漫画~

1.编译中真的不是我偷懒,程序编译那么久,我真的什么都做不了啊。2.sudo 三明治没有什么是一个“sudo”解决不了的问题。3.新货币对于我这种表情包大户,分分钟超越西虹市首富!4.电脑病毒范恩图——我擦,电脑突然变得好卡…

vue——scss变量全局使用

vue——scss变量全局使用 1.终端安装sass-resources-loader npm install sass-resources-loader --save2.vue.config.js注册 最重要,不然报错SassError: Undefined variable. module.exports {outputDir: ts-platform,css: {loaderOptions: {sass: {prependDat…

Python实现二叉树

二叉树算法python实现:1.添加节点2.广度优先遍历3.深度优先遍历:先序遍历,中序遍历,后序遍历 # -*- codding:utf-8 -*- class Node(object):"""节点"""def __init__(self,item):self.elem itemse…