网络爬虫弹幕

news/2024/7/19 9:40:39 标签: 爬虫

1.分析网页,获取代码,提取时间

想要提取出弹幕所在的节点,我们要使用 Beautiful Soup 解析模块,需要从 bs4 中导入 BeautifulSoup 模块

创建一个 BeautifulSoup 对象,传入变量 xml 和解析器 lxml,将该对象赋值给变量 soup。

接着使用 find_all() 函数中,传入 name 参数,其参数值为 d 。将返回的由所有 d 节点组成的列表,赋值给变量 content_all。

2.弹幕的发送时间进行统计,绘制折线图

我们可使用 for 循环遍历 range() 函数生成的 0-24 的数字。

将 30*x+1 赋值给变量 start, 30*(x+1) 赋值给变量 end;

使用 格式化 start 和 end,用 短横线相连 并赋值给 segment_range。

把 segment_range 作为字典 subtitlesDict 的键,添加进字典中,再将字典中键所对应的值设置为 0。

在 add_xaxis() 函数中传入一个参数,这个参数的类型是列表,列表中的元素顺序表示折线图 x 轴从左到右的刻度。

在这里我们要传入所有的月份,可以使用 keys() 函数获取字典中所有的键,再使用 list() 函数将格式转换成列表。


http://www.niftyadmin.cn/n/5404648.html

相关文章

【机器人最短路径规划问题(栅格地图)】基于模拟退火算法求解

代码获取方式:QQ:491052175 或者 私聊博主获取 基于模拟退火算法求解机器人最短路径规划问题(栅格地图)的仿真结果 仿真结果: 初始解的路径规划图 收敛曲线: 模拟退火算法求解的路径规划图 结论&#xff…

组合模式(Composite Pattern)C++

上一节:桥接模式(Bridge Pattern) C 文章目录 0.理论1.目的与应用场景2.实现方式 1.实践 0.理论 组合模式(Composite Pattern)是一种结构型设计模式,用于将对象组合成树形结构以表示“部分-整体”的层次结…

【Java】Java 中的方法引用写法

概述 方法引用(MethodReference)是Lambda表达式的另一种格式,在某些场景下可以提高代码的可读性 使用条件 只可以替换单方法的Lambda表达式 什么意思呢 ? 例如下面这个Lambda表达式就不可以使用方法引用替换,因为…

蓝桥杯复习之二分法与前缀和

题目:最佳牛围栏 题目链接:https://www.acwing.com/problem/content/104/ 题意:农夫约翰的农场由 N 块田地组成,每块地里都有一定数量的牛,其数量不会少于 1 头,也不会超过 2000 头。 约翰希望用围栏将一…

clickhouse 大表数据归档处理解决办法

本文作者为 360 奇舞团前端开发工程师 李彬 一、需求场景 基于目前项目在各个应用上的数据采集,尤其是性能监控上的采集,数据量越来越大,例如pv数据的采集表三个月的数据量已经在3亿,数据量小的也有几百万,但是目前的常…

CSS_实现三角形和聊天气泡框

如何用css画出一个三角形 1、第一步 写一个正常的盒子模型&#xff0c;先给个正方形的div&#xff0c;便于观察&#xff0c;给div设置宽高和背景颜色 <body><div class"box"></div> </body> <style>.box {width: 100px;height: 100px…

Qt | 停靠窗体显示日历和文本编辑器

QDockWidget 是一个非常灵活和强大的窗口小部件,它提供了许多常用的函数和方法来管理其行为和外观。以下是一些 QDockWidget 常用的函数和方法: setWidget(widget):将指定的 QWidget 设置为 QDockWidget 的内容。widget():返回 QDockWidget 当前的内容 Widget。setTitleBar…

学校机房Dev c++解决中文乱码问题

工具->编译选项->勾选 编译时加入以下命令 -fexec-charsetGBK -finput-charsetUTF-8 显示中文&#xff1a;工具->编辑器选项->去掉第一个的勾勾。