17.3 http协议进阶
目录
http协议进阶

在20.2 http协议基础我们对 http 协议做了简单介绍,本节我们来学 http 协议更深入的细节,包括:
- http 的状态追踪机制
- http 协议的报文
市面上有很多的协议抓包分析工具,常见的有 tcpdump, tshark, wireshark,常见浏览器也提供了 http 协议的网络分析工具,大家可以学习了解了解。
1 http状态追踪
http 协议是无状态的(stateless),服务器无法持续追踪访问者来源。因此在 http 协议的基础上有 cookie 和 session 机制用来帮助状态追踪。
2. http 报文
请求报文

|
|
响应报文

|
|
http 报文内容
http 的报文格式如上图所示,各个字段的含义如下
method: 请求方法,标明客户端希望服务器对资源执行的动作 – GET、HEAD、POSTversion:HTTP/<major>.<minor>,http 协议的版本status: 三位数字,如200,301, 302, 404, 502; 标记请求处理过程中发生的情况;reason-phrase:状态码所标记的状态的简要描述;headers:每个请求或响应报文可包含任意个首部;每个首部都有首部名称,后面跟一个冒号,而后跟上一个可选空格,接着是一个值;entity-body:请求时附加的数据或响应时附加的数据;
2.1 method(方法):
http 协议的请求方法:
GET:从服务器获取一个资源;HEAD:只从服务器获取文档的响应首部;POST:向服务器发送要处理的数据;PUT:将请求的主体部分存储在服务器上;DELETE:请求删除服务器上指定的文档;TRACE:追踪请求到达服务器中间经过的代理服务器;OPTIONS:请求服务器返回对指定资源支持使用的请求方法;
3.status(状态码)
http 协议的状态码:
1xx:100-101, 信息提示;2xx:200-206, 成功3xx:300-305, 重定向4xx:400-415, 错误类信息,客户端错误5xx:500-505, 错误类信息,服务器端错误
常用的状态码:
200: 成功,请求的所有数据通过响应报文的entity-body部分发送;OK301: 永久重定向,请求的URL指向的资源已经被删除;但在响应报文中通过首部Location指明了资源现在所处的新位置;Moved Permanently302: 临时重定向,与301相似,但在响应报文中通过Location指明资源现在所处临时新位置; Found304: 条件式请求,客户端发出了条件式请求,但服务器上的资源未曾发生改变,则通过响应此响应状态码通知客户端;Not Modified401: 需要输入账号和密码认证方能访问资源;Unauthorized403: 请求被禁止;Forbidden404: 服务器无法找到客户端请求的资源;Not Found500: 服务器内部错误;Internal Server Error502: 代理服务器从后端服务器收到了一条伪响应;Bad Gateway
4. headers(首部)
http 的首部是形如 Name: Value的键值对,可分为:
- 通用首部
- 请求首部
- 响应首部
- 实体首部
- 扩展首部
|
|
4.1 通用首部:
Date: 报文的创建时间Connection:连接状态,如keep-alive, closeVia:显示报文经过的中间节点Cache-Control:控制缓存Pragma:
4.2 请求首部:
- 基础请求首部
Accept:通知服务器自己可接受的媒体类型;Accept-Charset:Accept-Encoding:接受编码格式,如gzipAccept-Language:接受的语言Client-IP:Host: 请求的服务器名称和端口号Referer:包含当前正在请求的资源的上一级资源;User-Agent:客户端代理
- 条件式请求首部:
Expect:If-Modified-Since:自从指定的时间之后,请求的资源是否发生过修改;If-Unmodified-Since:If-None-Match:本地缓存中存储的文档的ETag标签是否与服务器文档的Etag不匹配;If-Match:
- 安全请求首部:
Authorization:向服务器发送认证信息,如账号和密码;Cookie: 客户端向服务器发送cookieCookie2:
- 代理请求首部:
Proxy-Authorization: 向代理服务器认证
4.3 响应首部:
- 信息性:
Age:响应持续时长Server:服务器程序软件名称和版本
- 协商首部:某资源有多种表示方法时使用
Accept-Ranges:服务器可接受的请求范围类型Vary:服务器查看的其它首部列表;
- 安全响应首部:
Set-Cookie:向客户端设置cookie;Set-Cookie2:WWW-Authenticate:来自服务器的对客户端的质询认证表单
4.4 实体首部:
- 基础实体首部
Allow: 列出对此实体可使用的请求方法Location:告诉客户端真正的实体位于何处Content-Encoding: 实体的编码方式 eg: gzipContent-Language:Content-Length: 主体的长度Content-Location: 实体真正所处位置;Content-Type:主体的对象类型,MIME 类型
- 缓存相关:
ETag:实体的扩展标签;Expires:实体的过期时间;Last-Modified:最后一次修改的时间