【Python实战】Python采集C站热榜数据

news/2024/7/19 10:26:41 标签: python, 爬虫

前言

大家好,我们今天来爬取c站的热搜榜,把其文章名称,链接和作者获取下来,我们保存到本地,我们通过测试,发现其实很简单,我们只要简单获取数据就可以。没有加密的东西。

 效果如下:

环境使用

模块使用

  • requests

模块介绍

  • requests

        requests是一个很实用的Python HTTP客户端库,爬虫和测试服务器响应数据时经常会用到,requests是Python语言的第三方的库,专门用于发送HTTP请求,使用起来比urllib简洁很多。

  • parsel

        parsel是一个python的第三方库,相当于css选择器+xpath+re。


http://www.niftyadmin.cn/n/376903.html

相关文章

【医学图像】图像分割系列.3 (uncertainty)

介绍几篇使用不确定性引导的医学图像分割论文:UA-MT(MICCAI2019),SSL4MIS(MICCAI2021),UG-MCL(AIIM2022). Uncertainty-aware Self-ensembling Model for Semi-supervise…

一、版本控制

1、什么是版本控制 1.1、版本控制的概念 版本控制(Revision control)是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。 1.2、版本控制的作用…

中介效应分析全流程汇总

一、中介效应说明 中介效应主要研究自变量对因变量影响的过程中,自变量是否通过中介变量再对因变量产生影响,那什么情况表明中介效应存在呢?如果自变量对因变量影响过程中,中介变量在模型中有着桥梁般的作用,那说明中…

cf1303 D 贪心

题意:https://www.luogu.com.cn/problem/CF1303D 思路:我们把问题拆分为二进制来看,那么从小到大,如果n这一位上有1,那么我们应该从i为往后找找到第一个不为0的cnt,由它分解下来是最优解。 /*keep on goi…

HNU-电子测试平台与工具2-I2C

FPGA I2C接口实现 计科210X wolf 202108010XXX 报告内容将包括: (1)如何描述组合电路、时序电路、状态机?如何编写TestBench? (2)ModelSim工具的使用; (3)EEPROM读写代码分析; (4)实验总结; 注意:其中(1)将在自定FSM中以实例的方式呈现,(2)将在(3)中提…

MySQL复习

文章目录 1、操作数据库1.1、操作数据库1.2、数据库的数据类型1.3、数据库的字段属性1.4、创建数据表1.5、MyISAM和InnoDB1.6、修改删除表 2、MySQL数据管理2.1、外键2.2、DML语言(全部记住)2.3、添加2.4、修改2.5、删除 3、DQL查询数据3.1、DQL3.2、查询…

GIT | 浅析原理篇

此篇文章主要是讲讲 一些 git 操作发生的时候 , .git 文件如何变化,git 背后发生了什么。磨刀不误砍柴工嘛!算是一篇视频观后笔记(文末取视频地址) 基础概念 Git 是一个代码版本管控的工具,是一个内容寻址文件系统&am…

Excel中index、match函数使用

Index和Match函数是Excel中非常强大的函数,通常用来在一个特定的数据范围中查找和定位特定的值。 Index函数用于从一个数组或矩阵中返回一个单元格或一组单元格的数值,而Match函数则用于查找特定值在数组或矩阵中的位置。接下来,我会逐步详细…