nodeJS 学习--用cheerio 制作超简单的网络爬虫

news/2024/7/19 11:48:47 标签: 爬虫, javascript
前置: 
1.安装好了nodejs
2.npm i cheerio
3.jquery选择器基础知识

var
https = require('https') var cheerio = require('cheerio')
// 简书首页
var url = "https://www.jianshu.com/" function filterSection(html) { //加载爬到的html结构 var $ = cheerio.load(html) var noteList = $('.note-list') var sectionData = [] noteList.each(function(item) { var content = $(this).find('.content')
// note 作者
var author = content.find('.author').find('.info').text()
// note title
var title = content.find('.title').text()
// note 内容摘要
var abstract = content.find('.abstract').text() var noteListData = { author: author, title: title, abstract: abstract } sectionData.push(noteListData) }) return sectionData } function print(sectionData) { sectionData.forEach((item) => { var author = item.author, title = item.title, abstract = item.abstract; console.log(author + '\n' + title + '\n' + abstract + '\n') }) } https.get(url, (res) => { var html = '' res.on('data', (data) => { html += data }) res.on('end', () => { var sectionData = filterSection(html)
print(sectionData) }).on(
'error', () => { console.log('错误') }) })

 

转载于:https://www.cnblogs.com/footstep/p/8275084.html


http://www.niftyadmin.cn/n/838892.html

相关文章

动态数据源切换

通过一个注解实现动态数据源切换 将要用的数据源名字,记录在threadLocal中通过AbstractRoutingDataSource,重写方法,将threadLocal中的数据源名字设置进去 。(当这个系统需要获取数据源的时候,会自动调用AbstractRouti…

MySQL 建表时date类型的默认值设置报错:时间的默认值有错误

将下面的内容在mysql中执行一下即可 select sql_mode; set sql_mode(select replace(sql_mode,‘NO_ZERO_IN_DATE,NO_ZERO_DATE’,’’)); select global.sql_mode; set global.sql_mode(select replace(global.sql_mode,‘NO_ZERO_IN_DATE,NO_ZERO_DATE’,’’));

网站部署——文件系统

文件系统方式部署C#网站 一、右键web项目点击发布 发布方法选择文件系统,目标位置自定义。需要注意的是发布到该文件夹的只有包含在项目中的文件夹,如果有未包含在项目中的文件,需要手动复制到目标位置处(bin和obj文件夹除外&…

windows关掉指定端口程序

netstat -ano|findstr 8080 taskkill /pid 11836 /f

大数据影响商业决策?

如今我们生活在信息经济体制中,公司采集和分析的数据越多,就能在做重要的商业决策时参考更多的信息。因此,公司不必再盲目地做决定或者只能瞎猜了。而些曾经根本无法测量的参量,如今也可以进行准确地测量。 现如今,大数…

Mysql连接 || Navicat连接 10038错误问题

90%的可能是服务没开 右键我的电脑(此电脑,计算机因操作系统名称有别)找到管理 然后找到服务(有的电脑是服务和应用程序)。找到mysql开头的服务开启即可

机器视觉检测系统在软包印刷中的应用

“怎样提高生产过程中的成品率,怎样提升我们的出厂质量检测工艺,成了我们工厂生产的瓶颈。”一个软包工厂负责人对我们的工作人员提出的问题, 当今软包印刷市场,竞争异常激烈,除了价格是客户考虑的因素之外,客户也非常…

遍历未知类型对象属性

引用:https://blog.csdn.net/ExceptionalBoy/article/details/79203465 反射获取field反射获取getXXX() 方法 Testpublic void test02 () throws IllegalAccessException {Object cc new Student(1, "cc"); // printBeanField(cc);printBeanField…