爬取涛声网音频

news/2024/7/19 9:53:16 标签: 爬虫, python

代码展现:350fa9a826dd45479c3054d3558c86af.png

代码详情:

import requests
import re
import os
filename = '声音//'
if not os.path.exists(filename):
    os.mkdir(filename)
def down_load(page):
    for page in range(page):
        page = page+1
        url = 'https://www.tosound.com/search/word-/page-'+str(page)
        headers = {'User-Agent':
                                       'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36',
                                   }
        response = requests.get(url=url,headers=headers)

        # print(response.text)
        href = re.findall('<div class="ui360 ui360-vis"><a href="(.*?)"></a></div>',response.text)
        title = re.findall('<a class="h6 text-white font-weight-bold" target="_blank" href=".*?" title="(.*?)">.*?',response.text)

        for href,title in zip(href,title):
            print(title,href)
            content = requests.get(url=href,headers=headers).content
            with open(filename+title+'.mp4',mode='wb') as f:
                f.write(content)
down_load(4)

结果展现:c7a97115217a4082953f7bfbcf9f27ae.png

总结:

1.这同样是一个动态加载的页面,在xhr中找到包后,发现跟前面爬好看视频的不同点在于,它不是json的数据格式,不确定链接在不在里面(其实是在的,用正则解析可以轻松获取)

2.所以首先还是打开一个音频,在media中找到他,复制url的关键部分,在All中搜索,找他含有这个链接的包,发现就是xhr获取到的。

3.接下来按照常规步骤走,复习了一遍os ,re.find all,zip,with open的用法。

 


http://www.niftyadmin.cn/n/5301522.html

相关文章

tomcat session cookie值设置逻辑

tomcat session cookie 值设置&#xff0c;tomcat jsessionid设置 ##调用request.getSession() Controller RequestMapping("/cookie") public class CookieController {RequestMapping("/tomcatRequest")ResponseBodypublic String tomcatRequest(HttpS…

基于STM32+QT设计的无人超市消费系统_139

基于STM32+QT设计的无人超市消费系统 一、前言 1.1 研究背景 随着科学技术的不断提高,计算机科学日渐成熟,其强大的功能已为人们深刻认识,它已进入人类社会的各个领域并发挥着越来越重要的作用。 超市形式在我国于20世纪90年代初期起步,现已成为我国零售业的一种重要形态…

商城小程序(4.搜索功能)

目录 一、自定义搜索组件1、自定义my-search组件2、通过自定义属性增强组件的通用性3、为自定义组件封装click事件4、实现首页搜索组件的吸顶效果 二、搜索建议1、渲染搜索页面的基本结构2、实现搜索框自动获取焦点3、实现搜索框的防抖处理4、根据关键词查询搜索列表5、渲染搜索…

bootstrap5实现的在线商城网站Parlo

一、需求分析 在线商城网站是指基于互联网技术搭建的电子商务平台&#xff0c;通过网站提供商品和服务的展示、销售和交易功能。它的主要作用包括以下几个方面&#xff1a; 商品展示和销售&#xff1a;在线商城网站是商家展示商品的平台&#xff0c;可以通过图片、文字、视频等…

【自动驾驶中的SLAM技术】第2讲:基础数学知识回顾

第二讲&#xff1a;基础数学回顾 文章目录 第二讲&#xff1a;基础数学回顾1 几何学1.1 坐标系1.2 坐标变换① 空间向量② 基变换③ 坐标变换④ 总结 1.3 四元数与旋转向量 2 运动学2.1 李群视角2.2 四元数视角2.3 四元数的李代数与旋转向量间的转换2.4 SO(3)t 上的运动学2.5 线…

Web网页开发-浮动-笔记

&#xff08;1&#xff09;使用浮动 设置元素同处一行&#xff0c;并且中间没有空隙 特性: 浮&#xff1a;设置浮动的盒子会在原地漂浮&#xff0c;向左向右&#xff0c;不占据原来的位置漏&#xff1a;前面的盒子设置浮动之后&#xff0c;位置不再占据&#xff0c;后面的元素…

Docker实战02|Namespace

在上一文《Docker实战01&#xff5c;容器与开发语言》中主要介绍了Docker的基本概念与Docker安装、Go语言安装等实战技巧。 本文继续针对Namespace技术展开讲解并利用Go语言进行实践。 本系列所有代码均已经开源。关公众号回复「Go语言实现Docker」即可获得。 目录 2.1.2 U…

app开发者对接广告联盟,需要哪些资质?广告变现收益如何?

对接广告联盟是APP流量变现最便捷的方式之一&#xff0c;如何最大化商业价值是APP开发者最关心的问题之一。 APP可以选择哪些类型的广告联盟&#xff1f;广告联盟的收益如何计算&#xff1f; 1、广告联盟的类型 广告联盟一般可以分为垂直型广告联盟、横向型广告联盟、视频广…