分享

TCP协议详解

 启云_9137 2020-08-18
TCP协议详解 - TCP状态转移

TCP状态转移过程

上图中的虚线表示典型的服务器端连接的状态转移,实现表示典型的客户端连接的状态转移。

CLOSED是一个假象的起始点,并不是一个实际的状态。

服务器状态转移过程

服务器通过listen调用进入LISTEN状态,被动等待客户端连接,因此执行的是被动打开。服务器一旦监听到某个请求(收到同步报文段),就将该连接放入内核等待队列中,并向客户端发送带SYN标志的确认报文段。此时连接处于SYN_RCVD。如果服务器成功地接受到客户端发送回的确认报文段,则该连接转移到ESTABLISHED状态。ESTABLISHED状态是连接双方能够进行双向数据传输的状态。

当客户端主动关闭连接时(通过close或shutdown系统调用向服务器发送借宿报文段),服务器通过返回确认报文段使连接进入CLOSE_WAIT状态。这个状态的含义很明确:等待服务器应用程序关闭连接。通常,服务器检测到客户端关闭连接后,也会立即给客户端发送一个结束报文段来关闭连接。这将使连接转移到LAST_ACK状态,以等待客户端对结束报文段的最后一次确认。一旦确认完成,链接彻底关闭了。

客户端状态转移过程

客户端通过connect系统调用主动那个与服务器建立连接。connect系统调用首先给服务器发送一个同步报文段,使连接转移到SYN_SENT状态。此后,connect系统调用可能因为如下两个原因失败返回:

  • 如果connect连接的目标端口不存在(未被任何进程监听),或者该端口仍被处于TIME_WAIT状态的连接所占用,则服务器将给客户端发送一个复位报文段,connect调用失败。
  • 如果目标端口存在,但connect在超时时间内未收到服务器的确认报文段,则connect调用失败。

connect调用失败将使连接立即返回到初始的CLOSED状态。如果客户端成功收到服务器的同步报文段和确认,则connect调用成功返回,连接转移至ESTABLISHED状态。

当客户端执行主动关闭时,它将向服务器发送一个结束报文段,同时连接进入FIN_WAIT_1状态。若此时客户端收到服务器专门用于确认目的报文段,则连接转移至FIN_WAIT_2状态。当客户端处于FIN_WAIT_2状态时,服务器处于CLOSE_WAIT状态,这一对状态是可能发生半关闭的状态。此时如果服务器也关闭连接(发送结束报文段),则客户端将给予确认并进入TIME_WAIT状态。

客户端还可以从FIN_WAIT_1状态直接进入TIME_WAIT状态,前提是处于FIN_WAIT_1状态的服务器直接收到带确认信息的结束报文段(而不是先收到确认报文段,再收到结束报文段)。

前面说过,处于FIN_WAIT_2状态的客户端需要等待服务器发送结束报文段,才能转移至TIME_WAIT状态。否则将它将一直停留在这个状态。如果不是为了在便关闭状态下继续接受数据,连接长时间地停留在FIN_WAIT_2并无益处。连接停留在FIN_WAIT_2状态的情况可能发生在:客户端执行半关闭后,未等服务器关闭连接就强行退出了。此时客户端连接由内核来接管,可称之为孤儿连接(和孤儿进程类似)。Linux为了防止孤儿连接长时间停留在内核中,在内核中定义下面两个变量:

TCP协议详解 - TCP状态转移

前者指定内核能接管的孤儿连接数目,后者指定孤儿连接在内核中生存时间。

TCP协议详解 - TCP状态转移

TCP连接的建立和断开过程中客户端和服务气端的状态变化

TIME_WAIT状态

客户端连接在收到服务器的结束报文段(报文段6)之后,并没有直接进入CLOSED状态,而是转移到TIME_WAIT状态。在这个状态,客户端连接要等待一段长为2MSL(Maximum Segment Life,报文段最大生存时间)的时间,才能完全完毕。

MSL是TCP报文段在网络中的最大生存时间,RFC1122的建议值是2min。

TIME_WAIT状态存在的原因有两点:

  • 可靠地终止TCP连接。
  • 保证让迟来的TCP报文段有足够的时间被识别并丢弃。

第一个原因很好理解。假设用于确认服务器结束报文段6的TCP报文段7丢了,那么服务器将重发结束保温段。因此客户端需要停留在某个状态以处理重复收到的结束报文段(即向服务器发送确认报文段)。否则,客户端将以复位报文段来回应服务器,服务器则认为这是一个错误,因为它期望的是一个像报文段7那样的确认报文段。

在Linux中,一个TCP端口不能被同时打开两次即以上。当一个TCP连接处于TIME_WAIT状态时,我们将无法立即使用该连接占用着的端口来建立一个新连接。反过来思考,如果不存在TIME_WAIT状态,则应用程序能够立即建立一个和刚关闭的连接相似的连接(IP和Port相同)。这个新的、和原来相似的连接被称为原来的连接的化身(incarnation)。新的化身可能收到属于原来的连接的、携带应用程序数据的TCP报文段(迟到的报文段),这显然是不应该发生的。这就是第二个原因。

另外,因为TCP报文段的最大生存时间是MSL。所以坚持2MSL时间的TIME_WAIT状态能够确保网络上两个传输方向上尚未被接收到的、迟到的TCP报文段都已经消失(被中转路由丢弃)。因此一个新的化身可以在2MSL时间之后安全的建立,而绝对不会收到属于原来连接的应用程序数据,这就是TIME_WAIT状态到持续2MSL时间的原因。

有时候我们希望避免TIME_WAIT状态,因为当程序退出后,我们希望能够立即重启它。但由于处在TIME_WAIT状态的连接还占用着端口,程序将无法启动(直到2MSL超时时间结束)。

TCP协议详解 - TCP状态转移
TCP协议详解 - TCP状态转移

这里我们以客户端形式运行nc命令,链接10.0.0.199的服务,且明确指定客户端使用12345端口。然后使用Ctrl+C终止客户端程序,接着又立即重启nc程序。

然后我们使用netstat命令查看,其输出最后一行显示连接进入TIME_WAIT状态,12345仍被占用,所有客户端重启失败。

对客户端程序而言,一般不用担心上述的问题,因为客户端一般使用系统自动分配的临时端口号来建立连接。

如果是服务器主动关闭连接后异常终止,则因为它总是使用同一个知名服务端口号。所以连接的TIME_WAIT状态将导致它不能立即重启。不过,我们可以用socket选项SO_REUSEADDR来强制进程立即使用处于TIME_WAIT状态的连接占用的端口。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多