爬虫相关的简单操作

news/2024/7/19 11:17:48 标签: 爬虫, python, 开发语言

爬虫:一种程序,从网站上爬取各种各样的数据,包括图片、视频、音乐、文档等

一、爬哪一个网址?

怎么找到一个视频的网址:

1、在浏览器右上角菜单--更多工具--开发者工具

2、选中网络(network)、媒体(media)

3、浏览器左上角点击刷新,看见1-3条数据

4、【点击】一条数据,即可在【标头】中看见这个链接

二、获取网址里面的数据

什么叫做模块?

在Python中,去实现一些具体的任务,带上模块

比如:向一个网址请求数据带上一个模块“requests" 请求模块。

导入“请求模块”:import requests

运行提示:No module named requests 没有找到该模块

解决方案:pycharm运行框中在终端中输入以下命令,等待下载就好

  /#安装请求模块
  pip install requests

requests是一个模块,有一个get功能,给一个网址URL,能够得到网址的响应res

res = requests.get(url)

三、把得到的内容保存到电脑上

  打开文件:
      open('文件名', '打开方式')  王志林!
      
      打开方式:
          1.读还是写的问题!
          2.文本文件还是二进制文件!
                                  文本文件txt  二进制文件mp3 mp4 avi rmvb jpg png bmp exe ppt doc xlsx。。。
          读  从文件中读取数据     r(read)        rb(read-binary)
          写  向文件中写入数据     w(write)       wb(write-binary)
          
          成绩单.xlsx   打开它  想看一下月亮同学  语文成绩是多少!  读!
          成绩单.xlsx   打开它  把李海超同学英语成绩填进去!        写!
  

四、完整示例代码

python"># 找一个网址 以字符串的形式保存在一个变量中!
url = "https://v26-web.douyinvod.com/351620a280feb6dc9002423f7a76fa5a/63d7cbeb/video/tos/cn/tos-cn-ve-15/owmt7LiA9okAJNfbClQg4znjYIueDAmwBgiAAs/?a=6383&ch=54&cr=3&dr=0&lr=all&cd=0%7C0%7C0%7C3&cv=1&br=998&bt=998&cs=0&ds=3&ft=LjhJEL998xIouEkmD0P5H4eaciDXtks0d5QEeg-czijD1Ini&mime_type=video_mp4&qs=0&rc=ZDM5aTY1ZjRpM2U7PDZnOkBpanc6OjQ6ZjxqaDMzNGkzM0BjMS4yNmA1NTUxYzY2XzRfYSNvYTA2cjRnLW1gLS1kLWFzcw%3D%3D&l=202301302053005280D9206CC8081A59C4&btag=20000"

# 导入请求模块 一定要先安装!
import requests

# 使用requests的get功能 获取网站的响应
res = requests.get(url)

# 打开一个空的视频(真·狗粮.mp4) 把得到res.content丢进去 得到一个可以播放的视频
open('美女1.mp4', 'wb').write(res.content)


http://www.niftyadmin.cn/n/5480947.html

相关文章

《Linux运维实战:Kylin V10操作系统开启安装软件保留缓存设置》

总结:整理不易,如果对你有帮助,可否点赞关注一下? 更多详细内容请参考:Linux运维实战总结 一、操作步骤 1、改系统/etc/yum.conf配置文件,开启安装软件保留缓存设置 [rootecs-90c2-0003 ~]# vim /etc/yum.…

【Qt】:对话框(一)

对话框 一.基本的对话框二.自定义对话框三.通过图形化界面自定义对话框四.关于对话框mode 对话框是GUI程序中不可或缺的组成部分。一些不适合在主窗口实现的功能组件可以设置在对话框中。对话框通常是一个顶层窗口,出现在程序最上层,用于实现短期任务或者…

RTSP/Onvif安防视频EasyNVR平台 vs.多协议接入视频汇聚EasyCVR平台:设备分组的区别

EasyNVR安防视频云平台是旭帆科技TSINGSEE青犀旗下支持RTSP/Onvif协议接入的安防监控流媒体视频云平台。平台具备视频实时监控直播、云端录像、云存储、录像检索与回看、告警等视频能力,能对接入的视频流进行处理与多端分发,包括RTSP、RTMP、HTTP-FLV、W…

【Java面试指北】单例模式

单线程下的单例模式: public class Singleton {private static Singleton instance;private Singleton() {}public static Singleton getInstance() {if (instance null) {instance new Singleton()}return instance;} }几个关键点: static 修饰&…

微服务-4 Nacos

目录 一、注册中心 二、配置管理 1. 添加配置 2. 配置自动刷新 3. 多环境配置共享​编辑 一、注册中心 服务列表: 服务详情: 二、配置管理 1. 添加配置 (1). 在 nacos 界面中添加配置文件: 配置列表: 配置详情:…

MySQL 8.0 克隆(clone)插件快速搭建主从复制

MySQL 8.0 clone插件提供从一个实例克隆数据的功能,克隆功能提供了更有效的方式来快速创建MySQL实例,搭建主从复制和组复制。本文介绍使用 MySQL 8.0 clone 插件快速搭建主从复制的方法 环境: mysql 8.0.29 主库:192.168.56.201…

Unity Pro 2019 for Mac:专业级游戏引擎,助力创意无限延伸!

Unity Pro 2019是一款功能强大的游戏开发引擎,其特点主要体现在以下几个方面: 强大的渲染技术:Unity Pro 2019采用了新的渲染技术,包括脚本化渲染流水线,能够轻松自定义渲染管线,通过C#代码和材料材质&…

HTML5学习记录

简介 超文本标记语言&#xff08;HyperText Markup Language&#xff0c;简称HTML&#xff09;&#xff0c;是一种用于创建网页的标准标记语言。 编辑器 下载传送门https://code.visualstudio.com/ 下载编辑器插件 标题 标题通过 <h1> - <h6> 标签进行定义。 …