实验十三————网页爬虫

news/2024/7/19 8:37:42 标签: 爬虫, python

第1关:爬取网页的表格信息

任务描述
本关任务:
湖南省统计局的湖南省第七次全国人口普查公报(第六号)

人口统计表格
表格的内容存储在

标签中
表格标签
爬取该页面的表格标签下的内容,存储在字符串bg中。

如何爬取网页数据
网络爬虫应用一般分为两个步骤:
(1)通过网络连接获取网页内容
requests

编程要求

将表格标签下的内容存储在字符串bg中

可参考下列视频
爬取湖南大学专业列表

开始你的任务吧,祝你成功!

import requests
from bs4 import BeautifulSoup
#代码开始
url = "http://tjj.hunan.gov.cn/hntj/tjfx/tjgb/rkpc/202105/t20210519_19079329.html" 
r=requests.get(url) 
r.encoding =

http://www.niftyadmin.cn/n/11003.html

相关文章

【大数据存储技术】第7章 MongoDB 的原理和使用

文章目录第7章 MongoDB 的原理和使用7.1 概述7.2 MongoDB 技术原理7.2.1 文档和集合7.2.2 分片机制和集群架构7.2.3 CouchDB 简介7.3 安装配置MongoDB7.3.1 单机环境部署7.3.2 MOngoDB 配置文件7.4 基本命令行操作7.4.1 Shell环境7.4.2 数据库和集合操作7.4.3 基本增删改查操作…

040几种原生手工封装UUID组件的方案

040几种原生手工封装UUID组件的方案 结合时间戳和自定义进制方案处理生成UUID /*** 结合时间戳和自定义进制方案处理生成UUID* @param startsWord 定义起始字符,如:as* @param hex 指定进制,如:10 16 32* @returns 32位字符+4个连接号-组成的uuid,如:as187860-7f8d-82a…

蓝桥杯刷题(二)

蓝桥杯刷题一.空间二.排序三.成绩分析四.蛇形填数五.跑步锻炼&#xff08;较难&#xff09;蓝桥杯题库一.空间 这道题很简单&#xff0c;要弄清单位间的转换和如何输出就可以啦 #include <stdio.h>int main() {printf("%.0f",256/(32/4/2/1024.0000/1024));ret…

接口测试 - 从0不到1的心路历程

我是一名做了三年测试的tester&#xff0c;2020年以功能测试工程师的身份入职北京一家医疗培训公司&#xff0c;入职后为了提高测试效率&#xff0c;接触到接口测试&#xff0c;以下是从零到现在 (还有很大完善的空间&#xff0c;所以不能算是1) 的一些心路历程。 做接口测试的…

HTML小游戏11 —— 横版恐龙大冒险游戏(附完整源码)

&#x1f482; 网站推荐:【神级源码资源网】【摸鱼小游戏】&#x1f91f; 前端学习课程&#xff1a;&#x1f449;【28个案例趣学前端】【400个JS面试题】&#x1f485; 想寻找共同学习交流、摸鱼划水的小伙伴&#xff0c;请点击【摸鱼学习交流群】&#x1f4ac; 免费且实用的计…

CSS的元素显示模式

元素显示模式是什么&#xff1f;&#xff1a; 由于网页中的标签非常多&#xff0c;在不同地方会用到不同类型的标签&#xff0c;了解他们的特点可以更好的布局我们的网页。 元素显示模式就是元素(标签)以什么方式进行显示&#xff0c;比如<div>独占一行&#xff0c;比如…

【排序专题】不会吧,不会吧居然还有人不懂排序算法?有彩蛋哦

文章目录1. 冒泡排序2. 选择排序3. 简单插入排序4. 希尔排序-->简单插入排序演变5. 归并排序(递归版本)6. 归并排序(非递归版本)7. 荷兰国旗问题8.由荷兰国旗问题进而引出快速排序 and 快速排序1.0版本9.快速排序2.0版本(挖坑法)10.快速排序 3.0版本(随机取数法)11.堆排序12…

react--编程式导航、antd的使用

编程式 1. 借助路由对象中的history 获取&#xff1a; this.props.history.push(/xx/xx) | this.props.history.replace(/xx/xx) 2. 传递sreach参数 this.props.history.push(/xx/xx?xxx100&xx111) 3. 传state参数 this.props.history.push(/xx,{id:1,title:…