爬虫工作量由小到大的思维转变---<第四十五章 Scrapyd 关于gerapy遇到问题>

news/2024/7/19 10:15:26 标签: 爬虫, scrapy, 分布式

前言:

本章主要是解决一些gerapy遇到的问题,会持续更新这篇!

正文:

问题1:

1400 - build.py - gerapy.server.core.build - 78 - build - error occurred (1, ['E:\\项目文件名\\venv\\Scripts\\python.exe', 'setup.py', 'clean', '-a', 'bdist_uberegg', '-d', 'C:\\Users\\Administrator\\AppData\\Local\\Temp\\gerapy-2ngnjwab'])
INFO - 2024-02-04 15:42:47,928 - process: 1400 - build.py - gerapy.server.core.build - 24 - build - successfully build project jihai to egg file None

------就是爬虫项目无法正常打包!

分析问题:

1.一开始以为是python版本的问题,然而不是的! 直接去缓存里面找错误日志:

2.调整思路

检查 setuptools 的版本

有时候问题可能与特定版本的 setuptools 有关。

1.检查依赖包版本号:
pip list
2.升级setuptools试试看:
pip install -U setuptools


3.搞定!


问题2:

描述:项目部署后,运行爬虫启动不起来;报错:

问题分析:

尽管使用的可能是 Twisted(一个异步网络框架,Scrapy 的依赖之一)和 Scrapyd,但在 Windows 系统上运行时,Twisted 需要 pywin32 来正确处理进程的启动。

解决:

环境下安装

pip install pywin32

成功:​​​​​​​


http://www.niftyadmin.cn/n/5363794.html

相关文章

什么是单点登录以及如何实现

一、定义 单点登录(Single Sign On),简称为 SSO,是目前比较流行的企业业务整合的解决方案之一,SSO的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统,SSO 一般都需…

git 入门教程

Git是一个版本控制系统,用于跟踪文件的变化并协同多人开发项目。以下是一个简单的Git入门教程: 1. **安装Git:** 首先,确保你的计算机上已安装Git。你可以从[Git官方网站](https://git-scm.com/)下载并按照说明安装。 2. **配置…

三层交换组网实验(思科)

华为设备参考:三层交换组网实验(华为) 一,技术简介 三层交换技术的出现,解决子网必须依赖路由器进行管理的问题,解决传统路由器低速、复杂所造成的网络瓶颈问题。一个具有三层交换功能的设备可简单理解为…

web 技术栈有哪些?

前端技术栈: HTML(超文本标记语言): 用于创建网页结构的标记语言,定义页面的内容和结构。 CSS(层叠样式表): 用于设计和排版网页的样式表语言,负责页面的外观和样式。 …

问题:0xc8前面加(byte) #人工智能#学习方法的原因是因为0xc8大于??????????? 。 #微信#其他#微信

问题:0xc8前面加(byte)的原因是因为0xc8大于??????????? 。 参考答案如图所示

【从零开始学设计模式】第三章_工厂模式

第三章_工厂模式 1.介绍 1.1定义 定义一个创建对象的接口,让其子类自己决定实例化哪一个工厂类,工厂模式使其创建过程延迟到子类进行。 1.2解决的问题 创建者和调用者的耦合,那么代码层面其实就是取消对new的使用。 1.3应用实例 需要一辆汽…

比特币ETF广告战大爆发!

作者:秦晋 贝莱德主动发起广告攻势。 2月1日,据外媒Cryptoslate报道,贝莱德在提交给美国SEC的一份文件中显示,其提出一项在建筑物侧面投影比特币ETF广告计划。 据介绍,广告内容为:「IBIT」信号是一个以迈阿…

后端软件三层架构

一、三层架构简介 三层架构是软件开发中广泛采用的一种经典架构模式,其核心价值在于通过清晰的任务划分来提高代码的可维护性和重用性。具体来说,三层架构主要包括以下三个层次: 持久层(DAO层):这一层主要…