python爬虫之scrapy之入门实例

news/2024/7/19 9:19:07 标签: python, 爬虫, scrapy

scrapy_0">scrapy之入门实例

首先我们需要参加一个scrapy工程
打开cmd输入

scrapy startproject 工程名

可以看到生成一个文件夹里面有以下图中文件
在这里插入图片描述
在这里插入图片描述
各个文件介绍
在这里插入图片描述
在这里插入图片描述
其次在工程中产生一个爬虫

scrapy genspider demo python123.io
//生产名为demo的爬虫

然后会生产一个demo.py文件
在这里插入图片描述
demo.py的内容
在这里插入图片描述
在这里插入图片描述
然后配置产生的spdier爬虫

# -*- coding: utf-8 -*-
import scrapy


class DemoSpider(scrapy.Spider):
    name = 'demo'
    # allowed_domains = ['python123.io']
    start_urls = ['http://python123.io/ws/demo.html']

    def parse(self, response):
        fname = response.url.split('/')[-1]
        with open(fname,'wb') as f:
            f.write(response.body)
        self.log('Saved file %s.'% fname)

最后执行demo.py

scrapy crawl demo

http://www.niftyadmin.cn/n/750832.html

相关文章

cpu怎么超频_cpu散热怎么选?科普小知识帮你省时间——超频三东海风云

去年锐龙3代上市,让我也想更新电脑了,提前半年就买了一个机箱摆着然后我就决定了amd 3700x,配微星x470的暗黑主板我买啥都特认真,不给他研究透了,不会入手的为了买这个主板,我还把微星的产品线梳理的了一下…

python爬虫之scrapy(yield关键字和基本使用)

yield关键字 生成器写法 def gen(n):for i in range(n)yield i**2看例子 scarpy基本使用 scarpy的使用步骤 scrapy爬虫的数据类型 1、request类 2、response类 3、item类 scrapy信息提取方法 介绍下css selector的基本使用

记账本的实现 php_省心省力省时间的记账方式:微信记账

从目前来说我们手头上的记账工具有两大类:一类是电子方式记账,如第三方记账工具(随手记),微信记账,支付宝记账第二类是纸质记账,采用的就是传统的纸质记账本记账。从便捷性来说,电子方式记账好于纸质本记账…

python之scrapy爬取股票信息

如果有错误请指出 爬取的股票数据的位置的确定 步骤 配置并发链接选项 步骤一: 步骤二:编写spider文件 打开对应文件 # -*- coding: utf-8 -*- import scrapy import reclass StocksSpider(scrapy.Spider):name stocksallowed_domains [baidu.com…

文本编辑软件哪个好_精品销售系统软件哪个好品牌公司

黑马房地产行业方案采用平台化和组件化的设计思想,有支持多操作系统和多数据库的系统平台;有提供审批流、预警、二次开发等强大的应用平台;有集团财务、办公自动化、人力资源、客户关系管理、商业智能的强大的产品支持精品销售系统软件哪个好品牌公司软件支持直销软…

mysql之视图的基本操作

视图的基本操作 一、创建视图 视图的本质是sql指令(select语句) 基本语法:create view 视图名字 as select指令;//可以的单表数据也可以是连接查询 查看视图结构,视图是虚拟表,故关于表的一些操作都适用…

c盘文件清理_C盘满了不用怕,教你清理C盘中的垃圾文件,瞬间释放海量空间

很多人使用电脑,都会把文件放到C盘,时间久了导致C盘空间越来越小,今天就来教你学会清理C盘中的垃圾文件,瞬间释放海量空间。一、自动清理1、下面就用Win10系统来演示,首先点击电脑左下角的Windows图标,打开…

mysql之事务安全

事务安全 一、事务概念 二、事务基本原理 mysql允许将事务统一进行管理(存储引擎必须是INNODB),将用户所在的操作暂时保存起来,不直接放到数据表(更新),等到用户确认结果之后再进行操作。 事务在mysql中…