python3下scrapy爬虫(第十四卷:scrapy+scrapy_redis+scrapyd打造分布式爬虫之执行)

news/2024/7/19 8:46:44 标签: 爬虫, python, 数据库

现在我们现在一个分机上引入一个SCRAPY的爬虫项目,要求数据存储在MONGODB中

现在我们需要在SETTING.PY设置我们的爬虫文件

再添加PIPELINE

注释掉的原因是爬虫执行完后,和本地存储完毕还需要向主机进行存储会给主机造成压力

设置完这些后,在MASTER主机开启REDIS服务,将代码复制放在其它主机中,注意操作系统类型以及配置

然后分别在各个主机上进行爬取,爬取速度加大并且结果不同

setting中加入这个可以保证爬虫不会被清空

设置这个决定重新爬取时队列是否清空,一般都用FALSE

我们现在是否分别到主机上执行爬取,现在我想直接在一台主机上控制所有的爬虫程序,现在引入SCRAPYD,他会启动WEB服务来管理所有的项目

看下步骤

1启动SCRAPYD

2可以远程访问

3运用SCPRAPYD-CLIENT来打包项目

4修改爬虫的scrapy.cfg文件

将地址改为远程的SCRAPYD服务地址

执行此命令完成部署

开启一个远程进程

开几条指令,执行几条进程,每一个JOB都个ID如果是多个机器的任务那么ID则不同

 

转载于:https://www.cnblogs.com/woshiruge/p/8456743.html


http://www.niftyadmin.cn/n/906900.html

相关文章

mysql面试题(2)

21.MySQL有哪些日志,分别是什么用处? mysql日志一般分为5种 错误日志:-log-err (记录启动,运行,停止mysql时出现的信息) 二进制日志:-log-bin (记录所有更改数据的语句,还用于复制…

python计算集合并集的运算符_Python学习04.17:Python set集合基本操作(添加、删除、交集、并集、差集)...

Python set 集合最常用的操作是向集合中添加、删除元素,以及集合之间做交集、并集、差集等运算,本节将一一讲解这些操作的具体实现。向 set 集合中添加元素set 集合中添加元素,可以使用 set 类型提供的 add() 方法实现,该方法的语…

webpack 中 css 和 html 刷新问题的解决思路

webpack-dev-server有热更新功能,当webpack入口的js文件被修改,则会自动更新数据并刷新浏览器。 css 问题 如果使用style-loader将样式添加到js文件中,在编写样式的时候可以享受热更新的效果,如果使用extract-text-webpack-plugin…

python中pandas处理csv_python使用pandas处理excel文件转为csv文件的方法示例

由于客户提供的是excel文件,在使用时期望使用csv文件格式,且对某些字段内容需要做一些处理,如从某个字段中固定的几位抽取出来,独立作为一个字段等,下面记录下使用acaconda处理的过程;import pandasdf pan…

Zookeeper详解-Cli(五)

ZooKeeper命令行界面(CLI)用于与ZooKeeper集合进行交互以进行开发。它有助于调试和解决不同的选项。 要执行ZooKeeper CLI操作,首先打开ZooKeeper服务器(“bin/zkServer.sh start”),然后打开ZooKeeper客户…

整合springCache简化缓存开发(技术篇)

1.在pom中导入springCache启动器的依赖 <!-- 整合springCache缓存--><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-cache</artifactId></dependency> <!-- 导入redi…

mooc数据结构与算法python版期末测验_中国大学MOOC(慕课)_数据结构与算法Python版_测试题及答案...

中国大学MOOC(慕课)_数据结构与算法Python版_测试题及答案更多相关问题采用fopen()函数打开文件&#xff0c;支持文件读取的参数有&#xff1a;【简答题】简单阐述高分子材料热-机械特征及成型加工的关系,并以示意图表示各种常见成型工艺的加工温度范围。【单选题】在一个比较合…

解决vue中element组件样式修改无效

vue中element组件样式修改无效 <style> .detail{.el-input__inner {height: 48px;} } </style> 直接写style注意不加scoped&#xff0c;然后用一个组件最外层的class包裹住&#xff0c;就不会改到所有的组件的样式了。 转载于:https://www.cnblogs.com/lusongshu/p…