爬虫框架学习

news/2024/7/19 11:29:09 标签: python, 爬虫, json

 

1. request.post 与request.data的区别 

 

 

views

from django.shortcuts import render, HttpResponse

def index(request):

    print(request.body)
    #输出结果:b'username=alex&password=123'

    print(request.POST)  #request.POST解析不了JSON格式.

    return HttpResponse('......')

request模块模拟发送数据

import requests


#请求体格式:
# requests.data得到的数据 :b'username=alex&password=123'
# requests.POST得到的数据 :<QueryDict: {'username': ['alex'], 'password': ['123']}>

#以urlencoded格式发送过去的.

r1 =requests.post(
    url ="http://127.0.0.1:8000/index/",
    data ={"username":"alex","password":123},
  )
print(r1.text)


#请求体格式: # requests.data得到的数据 :b
'username=alex&password=123' # requests.POST得到的数据 :<QueryDict: {}> #以json字符串格式发送 POST里拿不到数据. r1 =requests.post( url ="http://127.0.0.1:8000/index/", json ={"username":"alex","password":123}, ) print(r1.text)

 

 

 2 .scrapy的安装工作

 

a. 下载twisted 
http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

 

b. 安装wheel 
pip3 install wheel

 

c. 安装twisted (进入下载到twisted的目录里进行安装.)
pip3 install Twisted‑18.7.0‑cp36‑cp36m‑win_amd64.whl

 

d. 安装pywin32
pip3 install pywin32

 

e. 安装scrapy 
pip3 install scrapy 

 

f. 创建爬虫项目

scrapy startproject  xzx

创建spider

scrapy genspider chouti  chouti.com  (genspider相当于app)

 

 

 

1. scrapy 
        
        如何创建一个django程序?
            django-admin startproject mysite 
            
            cd mysite
            
            python manage.py startapp app01 
            
            python manage.py runserver 
        如何创建一个scrapy程序?
            scrapy startproject xzx 
            
            cd xzx 
            
            scrapy genspider chouti chouti.com 
            
            scrapy crawl chouti --nolog

 

转载于:https://www.cnblogs.com/mengbin0546/p/10417662.html


http://www.niftyadmin.cn/n/1471098.html

相关文章

VitualBox安装linux记录

下载镜像 CentOS 7镜像下载 阿里云站点&#xff1a;http://mirrors.aliyun.com/centos/7/isos/x86_64/ VirtualBox安装linux https://www.linuxidc.com/Linux/2016-09/135593.htm 按链接创建好后&#xff0c;提示 Raw-mode is unavailable courtesy of Hyper-V. (VERR_SUPDRV_N…

php配置sybase数据库,php获得sybase数据库内容的有关问题

php获得sybase数据库内容的问题数据库连接已经测试过了没问题&#xff0c;sql语句也没问题。现在问题是获取不到数据库里的数据&#xff0c;代码如下&#xff1a;public static function Connect(){$obj new DB();$conn$obj->Connectionsybase_connect(SERVER_NAME, USER, P…

「SCOI2014」方伯伯的玉米田 解题报告

#2211. 「SCOI2014」方伯伯的玉米田 发现是取一个最长不下降子序列 我们一定可以把一个区间加的右端点放在取出的子序列的最右边&#xff0c;然后就可以dp了 \(dp_{i,j}\)代表前\(i\)个玉米田末尾为\(i\)拔高过\(j\)次的最大答案\[ dp_{i,j}\max dp_{k,l}1(k<i,h_ij\ge h_kl…

接口测试系列:工作中所用(一:数据库配置.yml文件)

一&#xff1a;准备数据库配置信息&#xff1a;# 数据库环境1: host : xxxx port : 3306 user_name : xxx password : xxx2: host : port : 3306 user_name : password : 0: host : port : user_name : password : 3: host : port : user_name : passw…

ZigZag Conversion

https://www.cnblogs.com/TenosDoIt/p/3738693.html转载于:https://www.cnblogs.com/573177885qq/p/10421738.html

程序调试

对拍 $ Windows $ 下的对拍程序 借助 \(Windows\) 脚本echo off :loop r.exe > input.in coronas.exe <input.in > output.a std.exe <input.in > output.b fc output.a output.b if not errorlevel 1 goto loop 一直没有找到怎样能控制对拍次数,今天终于醒悟,可…

linux 扩展库php,Linux下为PHP添加扩展库

例子&#xff1a;添加mbstring扩展库1. 进入PHP源码目录(没有源码的可以先用命令&#xff1a;# php -v 查看版本号&#xff0c;然后上PHP官网下载源码)2. 进入PHPi源码下的FTP扩展库的目录&#xff1a;# cd [Your PHP Source Folder]/ext/mbstring3. 使用 phpize 命令生成配置文…

什么是逆向工程?黑客是如何构建可利用的漏洞?

互联网时代&#xff0c;在各个领域进行逆向工程的原因有很多&#xff0c;逆向工程起源于商业或军事优势的硬件分析。然而&#xff0c;逆向工程过程本身并不涉及以某种方式创建副本或更改工件;它只是一种分析&#xff0c;以便从产品中推断设计特征&#xff0c;而对其原始生产中涉…