爬虫实战进阶版【1】——某眼专业版实时票房接口破解

news/2024/7/19 9:53:13 标签: 爬虫, python, pandas

某眼专业版-实时票房接口破解

某眼票房接口:https://piaofang.maoyan.com/dashboard-ajax

前言

当我们想根据某眼的接口获取票房信息的时候,发现它的接口处的参数是加密的,如下图:

在这里插入图片描述

红色框框的参数都是动态变化的,且signKey明显是加密的一个参数。对于这种加密的参数,我们需要从它们的js文件中找到加密方式,因此我们需要找到signKey所在的位置。

解决方案

1.找到veri.js

如图所示:
在这里插入图片描述

首先需要根据这个路径找到veri.js文件,signKey这个参数就出现在这个里面

2.找到signKey所在位置

如图所示,signKey的位置
在这里插入图片描述

3.分析它所处的这个函数的内容

可以找到请求参数里面的几个变量,这说明我们找到的文件没有错。

在这里插入图片描述

index参数的获取

将其中的o(250)输出,如下图,得到floor:

在这里插入图片描述

说明Math[o(250)]其实是一个向下取整的函数,故index的获得方式就是:

Math.floor(1e3 * Math.random() + 1)

将它用Python实现就是:

python">math.floor(1000 * random.random() + 1)

signKey参数的获取

通过调式(加断点),可以发现signKey的值是由这个语句获得的:
在这里插入图片描述
而这个语句中含有另一个参数d和o(262),对于o(262),可以在控制台得到它的值,如下图所示:
在这里插入图片描述

对于参数d,我们继续寻找,发现d的产生位置:

在这里插入图片描述

然后d是和变量i相关的,i的定义如下:
在这里插入图片描述
然后在调试的时候可以知道d的值其实是一段变量i中的key和value的字符串,如图:
在这里插入图片描述
而i在还有一个变量key我们是不知道的,但是由于key的值是由o(260)产生的,则我们可以将它看出一个常量,控制台输出如下:
在这里插入图片描述

由此跟d相关的变量我们都可以知道了,跟它相关的变量如下:

  • User-Agent:代理
  • timeStamp:时间戳
  • index
  • channelId
  • method
  • sVersion
  • key
    由此可以生成跟d相关的字符串了,d的格式:
python">method=Get&index=123&...

d产生后,我们再回到生成signKey的位置:

在这里插入图片描述
此时需要注意是先对d进行了一些字符串替换,然后进行到加密函数中去的

继续调式,进入到加密函数当中:
在这里插入图片描述

这是一个md5加密的过程。

我们先对该函数进行验证,看是否会生成所需要的signKey:

在这里插入图片描述

以上图的d作为输入,得到结果如下:
在这里插入图片描述

最后的结果是一致的,说明就是这个函数。

综上所述,获取signKey的步骤为:

  • 将变量i中的参数全部获取
  • 将i中参数的key和value进行拼接,形成字符串d
  • 将d输入到加密函数中进行加密
  • 得到signKey

到此,signKey的获取也就结束了,那么接口破解也就完成了。

运行结果

在这里插入图片描述

关键代码

完整代码请前往:地址

python">def getIndex(self):
     return math.floor(1000 * random.random() + 1)

 def getD(self):
     # d是各种参数的组合,包括timeStamp,User-Agent,index,channelId,sVersion以及key
     self.pay_loads['index'] = self.getIndex()
     self.pay_loads['timeStamp'] = int(time.time() * 1000)
     logger.info('timeStamp:' + str(self.pay_loads['timeStamp']))
     d = 'method=GET&timeStamp=' + str(self.pay_loads['timeStamp']) + '&User-Agent=' + self.pay_loads['User-Agent'] + '&index=' \
         + str(self.pay_loads['index']) + '&channelId=' + str(self.pay_loads['channelId']) + '&sVersion=' + str(self.pay_loads['sVersion']) + \
         '&key=' + self.key
     # 找出目标字符串中的所有空白字符并用空格代替
     d = d.replace(r'/\s+/g'," ")
     return d

 # 得到signKey
 def getSignKey(self):
     md5 = hashlib.md5()
     d = self.getD()
     md5.update(d.encode('utf-8'))
     signKey = md5.hexdigest()
     self.pay_loads['signKey'] = signKey
     logger.info("signKey:" + signKey)

总结

本部分关键点在于找到请求参数所在文件的位置,然后逐步顺腾摸瓜即可。


http://www.niftyadmin.cn/n/113772.html

相关文章

外盘国际期货招商:每日港股市场要闻

美港电讯整理:每日港股市场要闻速递(3月2日 周四) 重要资讯 1. 工信部:进一步壮大新能源汽车产业,全面提升光伏、锂电供给能力,还将大力发展氢能、环保装备等产业,推动生物基新材料研发及产业化…

Stochastic Approximation 随机近似方法的详解之(二)Robbins-Monro Algorithm

6.2 Robbins-Monro Algorithm RM算法是随机近似领域的先驱性工作。众所周知的随机梯度下降算法是RM算法的一种特殊情况。后面我们再介绍具体的细节。 先看一个例子: 我们想要去求下面这个等式的根, BTW,很多问题可以被转化为求根问题。比…

JavaWeb--RequestResponse

Request&Response1 Request和Response的概述2 Request对象2.1 Request继承体系2.2 Request获取请求数据2.2.1 获取请求行数据2.2.2 获取请求头数据2.2.3 获取请求体数据2.2.4 小结2.2.5 获取请求参数的通用方式2.3 IDEA快速创建Servlet2.4 请求参数中文乱码问题2.4.1 POST请…

外置MOS管平均电流型LED降压恒流驱动器

产品描述 AP5125 是一款外围电路简单的 Buck 型平均电流检测模式的 LED 恒流驱动器,适用于 8-100V 电压范围的非隔离式大功率恒流 LED 驱动领域。芯片采用 固定频率 140kHz 的 PWM 工作模式, 利用平均电流检测模式,因此具有优异的负载调整 率…

后端程序员的前端基础-前端三剑客之HTML

文章目录1 HTML简介1.1 什么是HTML1.2 HTML能做什么1.3 HTML书写规范2 HTML基本标签2.1 结构标签2.2 排版标签2.3 块标签2.4 基本文字标签2.5 文本格式化标签2.6 标题标签2.7 列表标签(清单标签)2.8 图片标签2.9 链接标签2.10 表格标签3 HTML表单标签3.1 form元素常用属性3.2 i…

Modbus网关在锂电池干燥箱的应用

在锂离子电池生产过程中,将正负极片辊压绕卷再放入电池盒之后,须对锂电池电芯极组进行烘烤干燥。相信大家也了解水分对锂电池的性能影响是很大的,需要注液前在装配车间将锂离子电池电芯内部的水分去除,以免影响锂电池质量。在锂电…

Leetcode.面试题 05.02 二进制数转字符串

题目链接 面试题 05.02 二进制数转字符串 Mid 题目描述 二进制数转字符串。给定一个介于0和1之间的实数(如0.72),类型为double,打印它的二进制表达式。如果该数字无法精确地用32位以内的二进制表示,则打印“ERROR”。…

第十四节 包、权限修饰符、final、常量

包 1.同一个包下的类,相互可以直接访问。 2.不同包下的类要导包后才能访问。 AIT回车键导包。 权限修饰符 什么是权限修饰符? ●权限修饰符:是用来控制一个成员能够被访问的范围。 ●可以修饰成员变量,方法,构造器,内部类&…