中国大学哪家强?Python爬取排名榜,太棒啦(31)

news/2024/7/19 11:42:45 标签: python, 爬虫, 开发语言

小朋友们好,大朋友们好!

我是猫妹,一名爱上Python编程的小学生。

欢迎和猫妹一起,趣味学Python。

今日主题

如何用Python,抓取并分析2023中国大学排名数据。

用到的Python库有requests、bs4。

requests库

requests库是Python基于urllib,采用Apache2 Licensed开源协议的HTTP库。

它比urllib更加方便,完全满足HTTP测试需求。

Requests的哲学是以PEP20的习语为中心开发的,它比urllib更加Pythoner。

可以通过pip install requests 安装 requests库。

举个简单的例子:

我们日常看到的网页是这样的

我们看到的是部分信息,还有许多信息看不到的,比如排版、交互等。

如果要看更多信息,要在哪里看呢?

当然是网页源代码啦!
 

网页源代码长这样,这里面是前端信息,主要是html标签等。

看到网页源代码后,第一印象是啥?

很多,很复杂,很难手写。

有很多设计工具可以辅助生成网页源代码的。

要解析网页源代码,可以用Python,比如借助于bs4库。

bs4库

bs4 全名 BeautifulSoup,是编写 python 爬虫常用库之一,主要用来解析 html 标签。

可以通过pip install beautifulsoup4安装bs4 库。

说得简单点,bs库就是分析上述字符串,把自己感兴趣的信息提取出来。

将网页源代码解析后的信息是这样的:

测试代码

对中国大学排名,感兴趣的小伙伴,可以直接网站上浏览哈

好了,我们今天就学到这里吧!

如果遇到什么问题,咱们多多交流,共同解决。

我是猫妹,咱们下次见!


http://www.niftyadmin.cn/n/229444.html

相关文章

python win环境 pip setuptools wheel安装

2023年。 今年的测试小学弟问我python这个安装怎么这么啥b。没有安装pip时 python setup.py install时需要setuptools,安装setuptools需要安装pip。 我看了看他的python是官网下的压缩包解压来的,内部非常干净。python-3.10.11 1. 安装pip 遇到这种情况…

【CSS】使用 固定定位 实现顶部导航栏 ( 核心要点 | 固定定位元素居中设置 | 代码示例 )

文章目录一、核心要点分析1、顶部导航栏要点2、固定定位垂直居中设置二、代码示例一、核心要点分析 实现下图所示功能 : 上方有一个固定导航栏 , 水平居中设置 ;左右两侧各一个广告栏 , 垂直居中设置 ; 1、顶部导航栏要点 顶部导航栏要点 : 使用固定定位 , 上边偏移设置为 0 …

【Unity入门】12.MonoBehaviour事件函数

【Unity入门】MonoBehaviour事件函数 大家好,我是Lampard~~ 欢迎来到Unity入门系列博客,所学知识来自B站阿发老师~感谢 (一)常用的事件函数 (1)start和update方法 之前我们写的脚本,会默认帮助…

简单认识下with和上下文管理器

with 对于系统资源如文件、数据库连接、socket,应用程序打开这些资源并执行完业务逻辑之后,必须关闭(断开)该资源。系统允许打开的最大文件数量是有限的,如果我们打开文件后没有及时关闭,极端情况下会出现…

高频PCB电路设计常见的66个问题

随着电子技术快速发展,以及无线通信技术在各领域的广泛应用,高频、高速、高密度已逐步成为现代电子产品的显著发展趋势之一。信号传输高频化和高速数字化,迫使PCB走向微小孔与埋/盲孔化、导线精细化、介质层均匀薄型化,高频高速高…

Arduino控制MG995/MG996 360舵机连续旋转

Arduino控制MG995/MG996 360舵机连续旋转 参考: 调试从线机器人 - PID控制 - 安卓设置 : 12 步骤(附图) - 指导 (instructables.com) MG995 舵机 技术参数 将了解MG995舵机。MG995舵机电机是一种舵机电机,可以连续…

burpsuite抓包数据分析

以抓到的pikachu的数据为例: POST /pikachu/vul/burteforce/bf_form.php HTTP/1.1 # POST请求 被抓包的文件 http协议是1.1 Host: www.xxx.com #Host是主机 User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64; rv:49.0) Gecko/20100101Firefox/49.0 #user-agent是…

电商项目8:平台属性

电商项目8&#xff1a;平台属性1、后端1.1、属性分组模糊查询1.2、商品属性新增功能&#xff1a;保存关联关系1、后端 1.1、属性分组模糊查询 需要改造。当前端传0时候。模糊查询功能有点问题 AttrGroupServiceImpl Overridepublic PageUtils queryPage(Map<String, Obje…