本文是参考【图解TCP/IP】
TCP(Transmission Control Protocol)是传输控制协议,其作用于传输层,是一种提供了面向连接通信服务的协议
看TCP的英文全称就知道,其主要作用就是传输 、控制,传输的是数据,控制的是在传输过程中丢包后的重发 、分包乱序后的有序重组 、控制数据传输的速率防止网络拥塞等
这也是我们口中一直说的TCP是一种可靠的传输协议的原因。本文就将对TCP的作用过程以及一些机制进行讲解
TCP是面向连接进行通信服务的协议,所谓连接,其实就是在两台需要数据交互的主机之间建立一条虚拟的线路,所有的数据交互都是通过这条线路进行的,而TCP就负责这整个线路的创建、销毁、维护管理等工作
在建立连接之前,需要做一些准备,为了确保通信两端是否可以进行正常通信,发送端会通过TCP的首部发送一个SYN包作为建立连接的请求并等待接收端确认应答。如果接收端确认应答并返回一个ACK包,则表示接收端同意与发送端进行通信,然后发送端再次发送一个ACK包给接收端,表示已收到你的同意通信的消息了,此后两端就可以正常通信了;若接收端没有返回给发送端一个确认应答的ACK包,则表示不同意与发送端进行通信,那么两端自然无法进行后续的通信了
两端若在通信完成以后肯定需要断开通信,同样也需要两端互发包来确认是否要断开通信。比如,发送端先发送一个FIN包给接收端,告知想要断开连接,然后接收端可以返回给发送端一个ACK包表示同意你断开连接的请求,紧接着接收端也向发送端发送了一个FIN包,表示其也想断开连接的意愿,发送端在接收到该包后随即返回给接收端一个ACK包表示我也同意你断开连接,这样,两端就断开连接了
总结一下,一次完整的TCP连接的建立与断开至少需要来回发送7个包,其中建立连接需要发3个包,断开连接需要发4个包
我们来看一下完整的通信过程简图
这就是大家常说的三次握手,四次挥手的过程
如果不好理解上面的建立、断开连接过程,这里我再给大家举一个小小的例子
发送端与接收端通信,就好比我们日常生活中两个人打电话,例如现在A给B打电话
就这样一个简单的三次对话就确认了双方是想要互相通信的对象,因此连接就此建立了
那么当A和B聊完天,准备挂电话了
这三段对话就使通信双方确认了会话结束,因此连接就此断开了
TCP不是拿到一整个包就直接原封不动地传给接收端的,因为若这样做,即使是发生了数据丢失,也不知道到底丢失了哪部分的数据,因此其采用的就是将数据分段发送的方式
这里先说明一点,不光建立和断开连接时接收端需要向发送端发送请求应答,在数据交互时也是需要的
例如有一个数据包,我们可以将其按顺序给每一个字节都标上一个序号,然后我们假设每次发送1000个序号区间的数据给接收端,所以第一次发送的是 序号 1 ~ 1000 的数据,接收端接收到了以后会返回给发送端一个请求应答,告知发送端下一次请发送 序号 1001 ~ 2000 的数据过来,过程如图所示
上面我们假设的是每次发送1000个***区间的单位,而实际过程中,却不一定是这个值。
在前面的学习中,我们得知数据在数据链路层中传输会收到MTU(最大传输单元)的影响,若数据大于该值,IP则会被分片处理,因此我们尽可能地不让这种事情发生,那么就要让传输的每段数据大小小于该通信线路上最小的MTU,该值称为MSS(最大消息长度)
该值是会在建立连接的三次握手时被计算获得的,比如发送端在请求接收端的时候,在发送的包上附带上其线路上的MTU大小为4000,然后接收端在发送确认应答给发送端时,也会在包上附带上其线路上的MTU大小为1460,此时发送端接收到确认应答后比较两个MTU的大小,取其中小的那个值作为之后数据传输每段的数据大小
如图:
我们都知道,在数据传输过程中可能会因为各种原因出现丢包现象,而当出现丢包现象时,即发送端在发完数据以后等待一段时间,并未收到接收端的确认应答,则视为丢包,于是就会进行重发
其中丢包现象又分为两种:
以上两种情况如下图所示:
第一种情况:
第二种情况:
那么,发送端发送完数据后多久没收到确认应答才判定数据丢包了呢?这个都是随着网络环境的变化而变化的,TCP会在每次发包时计算往返时间以及偏差来决定等待的时间
若重发后又出现了丢包,则下一次等待的时间会以2倍、4倍的指数函数延长
但其又不会无限进行重发,当重发次数达到一定程度后,会判定为网络异常,两端通信就会被强制关闭
上面介绍了TCP将数据分段发送,虽然提高了传输的可靠性,但是存在着一个致命的缺点,那就是效率非常低,因为每送一段都要等待接收端的确认应答,若整个数据的分段较多,那么通信的性能可能就会很低了,因此TCP引入了窗口这个概念
所谓窗口,表示的是无需等待确认应答而可以连续发送的连续多段数据的区域,如图
我们假设每段数据长度为1000,这里的窗口大小为4段,因此发送端可以将这四段数据都分别发送出去并且不需要发送一段数据以后等待一个确认应答,如图
此时的窗口包含4个段,即窗口内包含4000个字节的数据,我们称之为窗口大小
接收端在返回相应的确认应答给发送端时,发送端会根据收到的确认应答,继续发送比该确认应答中***大4000的数据,如图所示
若使用了滑动窗口控制这一技术后,即使某段数据出现了丢包现象,也不会造成太大的影响,因为接收端会一边接收发送端传过来的数据,一边用某种方式告知发送端刚才丢失了哪段数据
接下来我们来介绍一下其作用过程,如图所示
图中,在发送第二段数据(1001 ~ 2000)时发生了丢包,因此接收端没有接收到对应的包,所以当发送端传过来第三段数据的时候,接收端返回的仍是第二段的确认应答,紧接着发送端分别发送了第四段、第五段数据,可接收端都返回的是第二段的确认应答
就这样连着三次发送了同一个确认应答给发送端,所以发送端得知刚才传输数据的过程中第二段数据发生了丢包,因此此时会将丢失的数据重发一份
然后接收端在接收到之前丢掉的那段数据以后,因为之前的数据都成功接收了,所以下一次就开始请求 5001 ~ 6000 这段数据了
有时,发送端发送给接收端的数据超过了接收端的最大承载能力,因此会造成数据无法接收的情况,从而导致之后会进行数据重发,这非常得浪费性能。
为了防止上述情况得发生,TCP提供了一种机制可以使发送端每次发送的数据尽可能得在接收端得承载能力之内,而其实现得方式就是接收端向发送端告知自己能够接收的数据大小,因此发送端每次发送的数据就都不会超过该值,我们称该值为窗口大小
一旦接收端暂时无法接收任何数据,它会告知发送端,因此发送端会暂停数据的发送,但为了后续数据的正常发送,发送端会不时地向接收端发送一个窗口探测,试探性地看一下接收端是否能继续接收数据了
具体的过程如下图所示
因为出现了窗口控制,数据不再是一段一段发送,而是连续发送多段数据包,因此有时如果遇到网络拥堵的情况,而我们又同时发送了大量的数据包,可能会导致网络瘫痪
TCP运用了一种叫做慢启动技巧缓解了上述情况,何为慢启动呢?就是不要在一开始就瞬间发送大量数据包,而是先发送一部分,然后根据收发情况再发送更多的数据包
具体过程我们来看一下
如图中,发送端的窗口大小为1000,因此只发送了一段长度为1000字节的数据包,此时接收端收到数据并返回一个确认应答,因此发送端将窗口大小加一,即窗口大小为2000 ;发送端又发送了两段长度为1000的数据包,接收端收到数据并返回两个确认应答,因此发送端将窗口大小加二,即窗口大小为4000 ;以此类推
总结: 发送端每次发送的数据包会以1,2,4的指数型增长
但窗口大小也不会无限指数型增大,而是会在达到某个值时进行一些调整,该值称为慢启动阈值