python网络爬虫笔记20:批量下载图片并将其转换为pdf文档

news/2024/7/19 11:10:17 标签: python, 爬虫, 开发语言, pdf

对于有些网页,你可以预览所有的页面内容,并且也可以通过F12获取到页面的URL,但是面对动辄几十页的图片,手动下载显然是不可行的。

在这里我们给出一个人机交互的通用解决策略。

第一步:使用F12获取页面所有感兴趣图片的URL

这一步看似简单,其实也暗藏玄机。因为有些网站你能看到所有图片,但是你在网页上点击F12并不会给你显示网址源码。这个时候,你就需要在网址上,点击F12一般都会显示出网页的源码。

第二步:手动刷新网页把所有的图片连接都刷出来

这一步就是手动刷出来所有的网址连接的URL,然后分析这些URL之间有什么规律;根据规律,我们就可以使用代码批量下载了。例如:

给出第一页和第二页的URL:

https://hbba.sacinfo.org.cn/hbba_onlineRead_page/385f9c


http://www.niftyadmin.cn/n/327409.html

相关文章

深析AutosarNM 网络管理

深析AutosarNM 网络管理 深析AutosarNM 网络管理1. AutosarNM 网络管理相关的专业术语2. 各种模式下的各种状态下,报文的收发情况汇总如下表:3. AutosarNM网络管理使用的时间参数:4. AutosarNM网络管理唤醒请求(Wake Up Request)5. ​​​​​…

AutoSAR PNC和ComM

文章目录 PNC和ComMPNC管理NM PDU结构及PNC信息位置如何理解节点关联PNCPNC状态管理 ComM 通道状态管理 PNC和ComM PNC 和 ComM层的Channel不是一个概念,ComM的Channel对应具体的物理总线数。 在ComM模块中,一个Channel可以对应一个PNC,也可…

玩转ChatGPT:AskYourPDF插件尝鲜

一、写在前面 首先,吐槽一下,感觉被CloseAI耍了: 上周发文说这一周对PLUS开放联网和插件功能,搞得网络一片狂欢。但是今天通过身边统计学发现,开通了PLUS后,拥有联网和插件功能的只是少数(而且…

详解C语言可变参数列表(stdarg头文件及其定义的宏)

前言:在一些函数定义时,()内的参数并不是所有的函数参数都是唯一的,如printf函数的定义 这里的省略号就代表printf函数的参数是可以变化的,而对于一些函数其参数是固定的,如strlen 之所以有这样…

PHP 根据经纬度获取地址

1if (!function_exists(getMapAddress)) {// 根据经纬度获取地址function getMapAddress($map_jd,$map_wd){// $url "https://apis.map.qq.com/ws/geocoder/v1/?location".$map_wd.",".$map_jd."&keyVPNBZ-QPIK4-XA2UM-DHFNI-M6MBJ-ASFWS";…

【Lychee图床】本地电脑搭建私人图床,公网远程访问

文章目录 1.前言2. Lychee网站搭建2.1. Lychee下载和安装2.2 Lychee网页测试2.3 cpolar的安装和注册 3.本地网页发布3.1 Cpolar云端设置3.2 Cpolar本地设置 4.公网访问测试5.结语 转发自CSDN风浪越大%鱼越贵的文章:Lychee图床 - 本地配置属于自己的相册管理系统并远…

skia字体绘制的实现简介

Skia在实现字体绘制方面,采用了一种称为“文本操作”的技术。这种技术包含了字体库、文本路径和字形对象等多个组成部分,它允许开发者将字符或文本内容以路径的形式呈现出来。 步骤 具体实现过程如下: 1. 获取绘制文本的字体对象&#xff…

剖析:在线帮助中心对企业能够起到什么作用?

随着互联网技术的不断发展和普及,越来越多的企业开始将自己的业务转移到了线上。这种转移不仅能够大幅度提高企业的效率,还能够让企业的服务更加贴近用户的需求。然而,在线服务也存在着一些问题,比如用户可能会遇到一些困难&#…