使用node抓取微信素材并处理多余js标签

news/2024/7/19 9:25:30 标签: 爬虫, node

node_0">使用node抓取微信素材

首先下载脚本文件,下载地址:
链接:https://pan.baidu.com/s/1xDq6tlfbUqcfASrMau58hg
提取码:fkzf

目录结构如下,可以下载gz压缩包,在本地使用git命令行禁止解压处理:tar -xzvf 文件名.gz
在这里插入图片描述

使用命令行进入对应目录,执行npm install,安装依赖库,安装成功后会生成node_modules目录,可以看到很多库,查看package.json文件可以发现这里我只安装了cheerio库,其功能与jquery一致,node版的jquery,操作也非常简单

安装成功后,开始抓取

打开index.js可以查看到要抓取的url地址,这里没有做单独的页面表单提交,所以直接修改url,注意根据http或者https协议修改对应的库
在这里插入图片描述
cd 到该文件所在目录,执行 node index.js
在这里插入图片描述
保存完毕,此时可以查看目录下多出test.html,直接打开即可

tips:

node版本不能太低,否则无法支持对应的库
文件保存路径可以自行修改,也可以搭建web环境,进行界面化操作


http://www.niftyadmin.cn/n/1482429.html

相关文章

如何在外部采用AES-128对HLS的TS流进行加密

http://www.wowza.cn/hls/howToSecureHlsByAes128External转载于:https://www.cnblogs.com/pengkunfan/p/4079833.html

git 强制同步远端仓库

在服务器上修改或增加文件而不是在本地进行操作,服务器上的git是没有推送权限的,只负责pull更新,所以当直接在服务器上操作文件的时候,就会与远程仓库冲突,git pull就会冲突 这种情况就需要使用强制同步,也…

CSS3 过渡特性创建信封效果的联系表单

最近给大家分享 CSS3 效果比较多,都是充分运用了 CSS3 来实现的。通过 CSS3 的新特性,我们创作出好的交互和效果的可能性大大增加。这篇文章中,我想与大家分享使用 CSS3 过渡特性实现的信封效果的联系表单。 效果演示 插件下载 CSS3 代码…

使用Django开发一个图书管理系统------02-需求分析设计

为什么80%的码农都做不了架构师?>>> BOOKMS是一个公司内部的图书管理系统。 本系列用多次迭代方法,逐步实现一个图书管理系统BOOKMS。 本文首先分析一下BOOKMS的需求,在后续内容中不断迭代开发,逐步用Django实现BOO…

git设置https克隆方式免密操作

具体操作: 切换成git方式,传送门: git ssh key配置 配置credential.helper: 首先简单介绍一下credential.helper这个配置项的含义:这个配置项允许用户自行指定git所使用的凭据管理工具。 简单粗暴的办法就是直接配置c…

Azure机构账户激活

在购买Azure之前,都会有个测试账号,用于登陆Windows Azure 管理平台https://manage.windowsazure.cn/当你购买了Windows Azure 企业版后,会有一封邮件提示你登陆https://ea.windowsazure.cn/去激活的Windows Azure账号然后输入你的Windows Az…

git克隆 码云 push时提示 DeployKey does not support push code fatal: Could not read from remote repository.

该错误说明是没有推送权限,只能拉取,如果是码云的话,说明是ssh秘钥部署有问题,部署的公钥只允许拉取服务 进入码云,部署公钥的地方 添加个人公钥即可

H.264远程视频监控系统

由usb摄像头驱动,h264编码库,采集read_video,传输,客户端显示组成 读取摄像头数据缓冲区是否有帧数据收到,有数据收到就读取数据并进行H264编码,把数据发送到socket发送到客户端。 配置内核:make menuconfig ARCHarm, 选择gerneral setup-->multimedi…