第一章 爬虫基础-请求与响应头 2021-09-03

news/2024/7/19 8:36:24 标签: 爬虫, http
http://www.w3.org/2000/svg" style="display: none;">

https://blog.csdn.net/qq_21438267/article/details/120103599">爬虫系列总目录

本章节介绍爬虫基础知识,包括网络,前端界面HTML,CSS, JS 等。
第一章 爬虫基础-网络传输协议
第一章 爬虫基础-请求与响应头
第一章 爬虫基础-前端HTML
第一章 爬虫基础-前端CSS
第一章 爬虫基础-前端JavaScript


请求与响应头

  • 爬虫系列总目录
  • 一、常见请求头
  • 二、常见响应头
  • 三、响应状态码


一、常见请求头

  • Host:对应网址URL中的Web名称和端口号,用于指定被请求资源的Internet主机和端口号,通常属于URL的一部分。
  • Connection:表示客户端与服务连接类型。
  • Cache-Control:表示缓存头,可以指定可缓存性,到期时间等。
  • Upgrade-Insecure-Requests:升级不安全的请求,意思是会在加载 http 资源时自动替换成 https 请求,让浏览器不再显示https页面中的http请求警报。
  • User-Agent:是客户浏览器的名称。
  • Accept:指浏览器或其他客户端可以接受的MIME文件类型,服务器可以根据它判断并返回适当的文件格式。
  • Referer:表明产生请求的网页来自于哪个URL。
  • Accept-Encoding:指出浏览器可以接受的编码方式。
  • Accept-Langeuage:指出浏览器可以接受的语言种类,如en或en-us指英语,zh或者zh-cn指中文。
  • Cookie:浏览器用这个属性向服务器发送Cookie。

二、常见响应头

  • Connection:keep-alive,告诉客户端服务器的TCP连接也是一个长连接,客户端可以继续使用这个tcp连接发送http请求。
  • Content-Encoding: gzip,告诉客户端,服务端发送的资源是采用gzip编码
  • Date: Wed, 24 Feb 2021 09:50:22 GMT,服务端发送资源时的服务器时间,GMT是格林尼治所在地标准时间。
  • Cookie:通过在 客户端 记录的信息确定用户的身份。
  • Session:通过在 服务器端 记录的信息确定用户的身份。

三、响应状态码

  • 100 ~ 199:表示服务器成功接收部分请求,要求客户端继续提交其余请求才能完成整个处理过程。
  • 200 ~ 299:表示服务器成功接收请求并已完成整个处理过程。常用200(OK 请求成功)。
  • 300 ~ 399:为完成请求,客户需进一步细化请求。
    例如:请求的资源已经移动一个新地址、常用302(所请求的页面已经临时转移至新的url)、307和304(使用缓存资源)。
  • 400 ~ 499:客户端的请求有错误,常用404(服务器无法找到被请求的页面)、403(服务器拒绝访问,权限不够)。
  • 500 ~ 599:服务器端出现错误,常用500(请求未完成。服务器遇到不可预知的情况)。

http://www.niftyadmin.cn/n/1857688.html

相关文章

微软:明年 7 月之前,所有会议线上举行

By 超神经内容提要:这场疫情对科技行业带来了重大影响。自 2 月以来,被迫取消或转至线上的科技峰会已经数不胜数。现在,微软已经决定,将明年下半年之前的所有活动转至线上,科技会议或许就此迎来变革?关键词…

第一章 爬虫基础-前端HTML 2021-09-03

爬虫系列总目录 本章节介绍爬虫基础知识,包括网络,前端界面HTML,CSS, JS 等。 第一章 爬虫基础-网络传输协议 第一章 爬虫基础-请求与响应头 第一章 爬虫基础-前端HTML 第一章 爬虫基础-前端CSS 第一章 爬虫基础-前端JavaScript 前端开发HTML 爬虫系列总目录1. HTML基本结构…

python 零售关联数据_采金数据

整理了一份关于零基础如何快速入门数据分析的文章。零基础入门——数据分析​mp.weixin.qq.com不知不觉已经到了19年的9月了,最近很多朋友一直私信我,想了解一下零基础怎么入门数据分析,如何成为一名数据分析师?如何做数据挖掘的工…

Rk3399全接口板 高性能高扩展全能型介绍

RK3399主控 RK3399是Rockchip产品线中性能最高的芯片,在应用中具有高性能和可扩展性。芯片的硬件规格在行业中处于领先地位。 RK3399的CPU采用big.LITTLE核心架构,采用双核Cortex-A72大核四核Cortex-A53小核结构。在整数,浮点数&#xff0c…

04-继承的细节问题

继承的细节问题: 1.子类继承父类之后,子类在实例化对象的时候,不会调用父类的构造方法,只会调用子类的构造方法。 2.如果子类要访问父类的构造方法,可以使用 父类:: __construct()或者是parent…

亚马逊工人罢工快递延误,谷歌无人机送货却业绩翻倍

By 超神经内容提要:无人机配送早在几年前就已实现,不过近期 ,它的存在显得尤为重要。随着美国疫情形势愈加严峻,多州颁布「居家令」。当出门购物已经成为奢侈的事情之时,无人机出场,为人们配送药物与食品&a…

第一章 爬虫基础-前端CSS 2021-09-03

爬虫系列总目录 本章节介绍爬虫基础知识,包括网络,前端界面HTML,CSS, JS 等。 第一章 爬虫基础-网络传输协议 第一章 爬虫基础-请求与响应头 第一章 爬虫基础-前端HTML 第一章 爬虫基础-前端CSS 第一章 爬虫基础-前端JavaScript 前端CSS爬虫系列总目录前…

PyCon US 2020 来了:人生苦短,不如线上学 Python

内容概述:疫情之下,越来越多的会议转战线上。近日,美国 Python 开发者大会( PyCon US),也将在线上拉开帷幕。这个大会有哪些看点,该如何参与进去,它能给 Python 使用者带来哪些帮助&…