Python爬虫---scrapy shell 调试

news/2024/7/19 11:54:09 标签: python, 爬虫, scrapy

Scrapy shell是Scrapy提供的一个交互式shell工具,它可以帮助我们进行爬虫的开发和调试。可以使用它来测试xpath或css表达式,查看它们是如何工作的,以及它们从你试图抓取的网页中提取的数据。它允许你在编写spider时交互地测试表达式,而无需运行spider来测试每个更改。

使用前提:已安装 ipython  安装: pip install ipython

使用步骤:

1. win+r 打开终端

2. 直接输入scrapy shell 域名  (注意:不能先进入ipythonpython

URL的基本组成部分:协议、域名、端口、路径 

3. 使用:

 xpath语法:

bs4语法(不建议):

 


http://www.niftyadmin.cn/n/5329413.html

相关文章

【Java】后端开发语言Java和C#,两者对比注解和属性的区别以及作用

欢迎来到《小5讲堂》 大家好,我是全栈小5。 这是《Java》序列文章,每篇文章将以博主理解的角度展开讲解, 特别是针对知识点的概念进行叙说,大部分文章将会对这些概念进行实际例子验证,以此达到加深对知识点的理解和掌握…

若依VUE启动异常缓慢,selectJobAll方法一直卡住不动的原因

今天发现后端启动异常缓慢,平常30秒启动的事情,启动了2分钟才启动成功 全网都找不到怎么解决,于是我就仔细排查了一番.终于仅仅只花了2分钟给我查到了,索性花超过五倍的时间来写个帖子帮帮有缘人. 看到了吗.不小心点错地方了,在自动装配区打了属性断点,属性断点是小眼睛标志, …

【git】CI/CD持续集成与部署C++示例

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍CI/CD持续集成与部署C示例。 学其所用,用其所学。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下,下次更新不…

2024秋招,深信服测试开发工程师一面

前言 回顾一下我秋招参加的第一次线下面试 这个面试体现出了我的很多弱点,也为我后面的改进起着很重要的作用 时间:40min 平台:线下面试 过程 1、个人介绍 2、项目经历 3、团队项目中负责的模块,队友都负责哪些工作&#x…

The Parade

Berland军队正在为一场大型阅兵式做准备。已经决定,参与其中的士兵将被分为k行,所有行都将包含相同数量的士兵。 当然,并不是每一次把士兵排成k排都是合适的。同一排中所有士兵的身高差异不应超过1。每个士兵的身高是一个介于1和n之间的整数。…

Liunx修改文件名的三种方法分享

在Linux中,你可以使用以下三种方法来修改文件名: 使用mv命令: mv命令是Linux中最常用的用于移动和重命名文件或目录的命令。你可以使用mv命令来修改文件名,只需提供原始文件名和新文件名即可。例如: mv old_filename …

【python】10.图形用户界面和游戏开发

图形用户界面和游戏开发 基于tkinter模块的GUI GUI是图形用户界面的缩写,图形化的用户界面对使用过计算机的人来说应该都不陌生,在此也无需进行赘述。Python默认的GUI开发模块是tkinter(在Python 3以前的版本中名为Tkinter)&…

UI自动化测试框架

文章目录 UI自动化基础什么是UI自动化测试框架UI自动化测试框架的模式数据驱动测试框架关键字驱动测试框架行为驱动测试框架 UI自动化测试框架的作用UI自动化测试框架的核心思想UI自动化测试框架的步骤UI自动化测试框架的构成UtilsLog.javaReadProperties.Java coreBaseTest.ja…