HTTP协议
HTTP又叫超文本传输协议。它定义了客户端和服务端之间该如何通信,以交换或者传输超文本(如HTML文档)。HTTP协议是一个无连接、无状态的协议,即每次请求都需要建立新的连接,且服务器不会保存客户端的状态信息。其实,在之前的自定义网络版计算器中我们就已经知道,协议其实就是约定好通信双方发送数据的格式,也可以称为某种结构体。HTTP协议也同样如此,只不过这种约定会比我们之前自定义的要严谨一些。
下面我们来看看HTTP协议请求与响应的格式
HTTP请求
下面是HTTP请求报文的格式
其中:
- 首行(请求行)的组成部分为:【方法】+【url】+【版本】
- Header(请求报头):请求的属性,冒号分割的键值对;每组属性之间使用
\r\n
分隔 - Body(请求正文):空行后面的内容都是Body,允许空字符串,如果非空,那么Header中会有一个属性Content-Length来标识Body长度。
如何知道获取到了一个完整的请求报文呢?
比如现在从网络流中读取到了一个字符串,怎么知道这个字符串是否包含一个完整的请求报文呢?
可以按照换行符为分隔符。如果有获取到空行,那么说明报头部分已经全部获取了,再从报文中拿到content-length属性的值,就能知道请求正文的数据大小了。
关于HTTP请求的请求报文中的详细字段属性,可以看下图:
上图就是一个GET请求的报文
下面来解释一些常见的请求报文中字段属性
请求方法:
其中最常见的就是GET和POST方法
GET和POST方法的区别
- GET请求的参数附加在URL末尾,用
?
分隔,参数之间用&
分隔。这样一来,参数就会暴露在URL中,不安全。且浏览器对URL长度有限制,这种方式传输的数据量就比较小。 - POST 请求的参数放在请求体中,较为隐蔽,且传输的数据量较大。
HTTP响应
来看响应的报文结构
看上去其实和请求报文的结构是类似的,只不过响应报文的第一行叫做状态行。
下面来看看一个完整的应答报文的样例:
HTTP的状态码
常见的状态码,比如200(OK),404(not found)、403(Forbidden)、302(Redirect, 重定向), 504(Bad Gateway)。
下面对常见的状态码及其含义做出总结
关于重定向:
- 永久重定向,即状态码为301。表示请求的资源已被永久移动到新位置。客户端应该在将来的请求中使用新的 URL。浏览器和搜索引擎在收到301重定向的响应后,会缓存新的URL,下次访问旧的url就会自动跳转到新的url。
- 临时重定向,即状态码为302。表示请求的资源暂时转移到了新url,触发重定向后会访问另一个url,但是后续如果继续请求旧的url,还是会触发重定向。
- 区别在于,触发一次永久重定向后的请求,即使访问旧url也会自动跳转到新的url中(这个过程不会再访问url)。但如果是临时重定向,下次访问还是先访问旧的url,再重新触发重定向,跳转到新的url。
- 新的url会放在响应的Location选项中
HTTP常见Header
- Content-Type:正文的数据类型(text/html)
- Content-Length:正文的长度
- Host:客户端告诉服务器,所请求的资源是在哪个主机的端口上
- User-Agnent:声明用户的操作系统和浏览器的版本信息
- referer:当前页面是从哪一个页面跳转过来的
- Location:搭配3XX状态码使用,告诉客户端接下来要去哪里访问
- Cookie用于在客户端存储少量信息,通常会实现会话功能
- connection:用于控制和管理客户端与服务器之间的连接状态。
- Connection: keep-alive:表示希望保持连接以复用 TCP 连接(长连接)
- Connection: close:表示请求/响应完成后,应该关闭 TCP 连接(短连接)
其中HTTP/1.1协议默认使用的就是长连接,又称持久连接。当客户端和服务端都不指定关闭连接时,保持打开状态,以便后续的请求和响应可以复用同一个链接。HTTP/1.0协议则相反,默认连接是非持久的,如果要想实现持久连接,那就修改报文中Connection的值
HTTP版本
- HTTP/0.9:最初的版本,只能传输HTML文本,且没有报头和正文,仅支持GET请求
- HTTP/1.0:引入了报头、正文和响应码等,且支持GET和POST请求。
- HTTP/1.1:在1.0的基础上,增加了长连接属性、管道化、缓存控制等功能
- HTTP/2.0:使用二进制进行传输,减少了解析开销。多路复用,单一连接上可以并发处理多个请求和响应。服务器可以主动推送资源到客户端,减少了延迟。客户端可以指定请求的优先级,优化资源加载顺序。
- HTTP/3.0:使用 QUIC 协议替代 TCP 协议,基于 UDP 构建的多路复用传输协议。减少三次握手的时间,提高建立连接的速度。
下面来实现一个HTTP服务器
点击查看源码