用Python下载漫画,每天掌握一个实用知识

news/2024/7/19 9:14:43 标签: python, 爬虫, 开发语言

嗨嗨,大家好

最近看小说和漫画看的有点上头…

就顺便用Python来采集一下漫画吧

随便抓个漫画分享一下,搞清楚思路后,自己多练练就能自己采集想看的漫画咯

请添加图片描述

知识点:

  • 爬虫基本流程
  • 保存海量漫画数据
  • requests的使用
  • base64解码

开发环境:

  • 版 本:python 3.8
  • 编辑器:pycharm
  • requests: pip install requests
  • parsel: pip install parsel

python_22">如何安装python第三方模块:

  1. win + R 输入 cmd 点击确定, 输入安装命令 pip install 模块名 (pip install requests)
    回车
  2. 在pycharm中点击Terminal(终端) 输入安装命令

实现代码:

  1. 发送请求
  2. 获取数据
  3. 解析数据
  4. 保存数据

代码

import base64
import requests
import re
import json
import parsel
import os
# 伪装
headers = {
    # 用户信息
    'cookie': '__AC__=1; tvf....

在这里插入图片描述

源码.资料.素材.点击领取即可

select = parsel.Selector(requests.get(main_url, headers=headers).text)
title_list = select.css('.chapter-page-all.works-chapter-list li a::text').getall()
link_list = select.css('.chapter-page-all.works-chapter-list li a::attr(href)').getall()

for title, link in zip(title_list, link_list):
    url = 'https://ac.qq.com' + link
    title = title.strip()
    if not os.path.exists(f'中国惊奇先生/{title}'):
        os.makedirs(f'中国惊奇先生/{title}')
    # 1. 发送请求
    response = requests.get(url=url, headers=headers)
    print(title, url)
    # 2. 获取数据
    html_data = response.text
    # 3. 解析数据
    DATA = re.findall("var DATA = '(.*?)'", html_data)[0]
    for i in range(len(DATA)):
        try:
            json_str = base64.b64decode(DATA[i:].encode("utf-8")).decode("utf-8")
            json_str = re.findall('"picture":(\[.*?\])', json_str)[0]
            # 字符串 转 字典/列表
            json_list = json.loads(json_str)
            count = 1
            for imgInfo in json_list:
                imgUrl = imgInfo['url']
                print(imgUrl)
                # 4. 保存数据
                img_data = requests.get(url=imgUrl).content
                with open(f'中国惊奇先生/{title}/{count}.jpg', mode='wb') as f:
                    f.write(img_data)
                count += 1
            break
        except:
            pass

请添加图片描述

最后效果

在这里插入图片描述

在这里插入图片描述

好啦,文章分享到这里也就结束啦

想用视频学习Python的可以点击此处~

或者在小破站搜索:Python小圆

对文章有问题的,或者有其他关于python的问题,可以在评论区留言或者私信我哦
觉得我分享的文章不错的话,可以关注一下我,或者给文章点赞(/≧▽≦)/

请添加图片描述


http://www.niftyadmin.cn/n/3248.html

相关文章

c语言之函数篇

前言 各位小伙伴们,我们又见面了,很高兴你们能看到这篇文章,和牛牛一起学习c语言的知识。本次牛牛分享的是c语言中有关 函数知识。一起开始学习吧! 目录前言一、认识函数二、函数的分类2.1 库函数的介绍2.2 自定义函数的介绍三、函…

学完Python,不做程序员,只接兼职,哎,就是玩儿

现在这个时代,人人开始追求做斜杠青年,多方面开展副业,赚取几份工资。有很多朋友就抓住了Python的风口,靠着Python兼职月入一万。那么学完Python,有哪些可以做的兼职呢? 一、闲暇时间,接自由单…

史上最全ubuntu18.04安装教程|搜狗输入法配置教程|网络配置|相关命令配置

史上最全ubuntu18.04安装教程|搜狗输入法配置教程|网络配置|相关命令配置一、ubuntu18.04获取和安装二、ubuntu18.04 配置网络和安装搜狗输入法三、搜狗输入法安装在ubuntu成功界面一、ubuntu18.04获取和安装 获取这里给大家推荐一个CSDN最新出的工具,猿如意 如下&a…

双十一大促客服必备话术

进入10月下旬以后,各个电商平台都在为接下来的“双十一”大促紧锣密鼓地准备着,客服也越来越忙,客服的首要任务就是整理出一套完美的话术,便于及时回复。 前言 进入10月下旬以后,各个电商平台都在为接下来的“双十一”…

【02】概率图模型在真实世界中的应用案例

概率图模型在真实世界中的应用案例 概率图模型有许多不同的实际应用。 为了激起大家对概率图模型的兴趣,也为了让大家能够对概率图模型有感性的认知,本章我会分享概率图模型的诸多实际应用案例。 文章目录图像中的概率模型图像生成图像修复图像降噪语言…

【Linux】Linux下的自动化构建工具——make/makefile

💬推荐一款模拟面试、刷题神器 、从基础到大厂面试题:👉点击跳转刷题网站进行注册学习 目录 一、make和makefile的区别 二、makefile的原理 1、make的原理详解 2、临时文件的清理 3、文件的三个时间 三、makefile的推导规则 四、实现一…

基于栈的字节码解释执行引擎

解释执行 无论是解释还是编译,也无论是物理机还是虚拟机,对于应用程序,机器都不可能如人那样阅 读、理解,然后获得执行能力。大部分的程序代码转换成物理机的目标代码或虚拟机能执行的指令集之前,都需要经过图8-4中的…

python数据结构——二叉树(一)遍历方法

二叉树是一种最简单的树形结构,二叉树的定义是用递归的方式 二叉树具有五种基本形态: 1.空二叉树。 2.只有一个根结点。 3.根结点只有左子树。 4.根结点只有右子树。 5.根结点既有左子树又有右子树。…