目錄
???♂? TCP/IP協(xié)議詳解
???♂? TCP/IP協(xié)議的分層模型
OSI模型的七層框架
TCP/IP協(xié)議與七層ISO模型的對(duì)應(yīng)關(guān)系
(一)TCP/IP協(xié)議的應(yīng)用層
(二)TCP/IP協(xié)議的傳輸層
(三)TCP/IP協(xié)議的網(wǎng)絡(luò)層
(四)TCP/IP協(xié)議的鏈路層
???♂? 圖解 物理層:使用MAC解決設(shè)備的身份證問(wèn)題
通信的原始時(shí)代
集線器的誕生
???♂? 圖解 數(shù)據(jù)鏈路:使用交換機(jī)解決MAC 地址映射問(wèn)題
集線器的問(wèn)題
交換機(jī)的誕生
MAC 地址和端口的映射記錄
???♂? 圖解 傳輸層:IP地址和路由器
二層交換機(jī)的問(wèn)題
IP地址的誕生
路由器的誕生
子網(wǎng)的由來(lái)
路由表的由來(lái)(和Mac表的由來(lái)好像,都是逼出來(lái)的)
???♂? 圖解:整個(gè)傳輸過(guò)程
電腦視角
交換機(jī)視角
路由器視角
參考的網(wǎng)絡(luò)拓?fù)鋱D
這時(shí)如果 A 給 F 發(fā)送一個(gè)數(shù)據(jù)包,能不能通呢?如果通的話整個(gè)過(guò)程是怎樣的呢?
詳細(xì)過(guò)程文字描述
???♂? HTTP報(bào)文傳輸原理
HTTP報(bào)文傳輸過(guò)程
數(shù)據(jù)封裝和分用
???♂? TCP協(xié)議的報(bào)文格式
(一)源端口號(hào)
(二)目的端口號(hào)
(三)序號(hào)(Sequence Number)
(四)確認(rèn)序號(hào)(Acknowledgment Number)
(五)頭部長(zhǎng)度
(六)預(yù)留6位
(七)控制標(biāo)志
(八)窗口大小
(九)校驗(yàn)和計(jì)算
(十)緊急指針
(十一)可選項(xiàng)和填充部分
???♂? TCP的三次握手
三次握手過(guò)程
三次握手的圖解
???♂? TCP的四次揮手
四次揮手具體過(guò)程
四次揮手圖解
???♂? 三次握手、四次揮手的常見(jiàn)面試題
問(wèn)題(1):為什么關(guān)閉連接的需要四次揮手,而建立連接卻只要三次握手呢?
問(wèn)題(2):為什么連接建立的時(shí)候是三次握手,可以改成兩次握手嗎?
問(wèn)題(3):為什么主動(dòng)斷開(kāi)方在TIME-WAIT狀態(tài)必須等待2MSL的時(shí)間?
問(wèn)題(4):如果已經(jīng)建立了連接,但是Client端突然出現(xiàn)故障了怎么辦?
?? 參考資料
?
???♂? TCP/IP協(xié)議詳解
TCP/IP協(xié)議包含了一系列的協(xié)議,也叫TCP/IP協(xié)議族(TCP/IP Protocol Suite,或TCP/IP Protocols),簡(jiǎn)稱(chēng)TCP/IP。TCP/IP協(xié)議族提供了點(diǎn)對(duì)點(diǎn)的連結(jié)機(jī)制,并且將傳輸數(shù)據(jù)幀的封裝、尋址、傳輸、路由以及接收方式,都予以標(biāo)準(zhǔn)化。
相關(guān)資料參考:面試高頻—TCP/IP十大問(wèn)題—程序員必備基礎(chǔ)素養(yǎng)
相關(guān)資料參考:通俗易懂TCP/IP協(xié)議 |?網(wǎng)絡(luò)編程套接字 | 初識(shí)網(wǎng)絡(luò)原理?
???♂? TCP/IP協(xié)議的分層模型
在展開(kāi)介紹TCP/IP協(xié)議之前,首先介紹一下七層ISO模型。國(guó)際標(biāo)準(zhǔn)化組織ISO為了使網(wǎng)絡(luò)應(yīng)用更為普及,推出了OSI參考模型,即開(kāi)放式系統(tǒng)互聯(lián)(Open System Interconnect)模型,一般都叫OSI參考模型。OSI參考模型是ISO組織在1985年發(fā)布的網(wǎng)絡(luò)互連模型,其含義就是為所有公司使用一個(gè)統(tǒng)一的規(guī)范來(lái)控制網(wǎng)絡(luò),這樣所有公司遵循相同的通信規(guī)范,網(wǎng)絡(luò)就能互聯(lián)互通了。
OSI模型的七層框架
OSI模型定義了網(wǎng)絡(luò)互連的七層框架(物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、傳輸層、會(huì)話層、表示層、應(yīng)用層),每一層實(shí)現(xiàn)各自的功能和協(xié)議,并完成與相鄰層的接口通信。OSI模型各層的通信協(xié)議,大致舉例如下表所示:
表:OSI模型各層的通信協(xié)議舉例
應(yīng)用層 |
HTTP、SMTP、SNMP、FTP、Telnet、SIP、SSH、NFS、RTSP、XMPP、Whois、ENRP、等等 |
表示層 |
XDR、ASN.1、SMB、AFP、NCP、等等 |
會(huì)話層 |
ASAP、SSH、RPC、NetBIOS、ASP、Winsock、BSD Sockets、等等 |
傳輸層 |
TCP、UDP、TLS、RTP、SCTP、SPX、ATP、IL、等等 |
網(wǎng)絡(luò)層 |
IP、ICMP、IGMP、IPX、BGP、OSPF、RIP、IGRP、EIGRP、ARP、RARP、X.25、等等 |
數(shù)據(jù)鏈路層 |
以太網(wǎng)、令牌環(huán)、HDLC、幀中繼、ISDN、ATM、IEEE 802.11、FDDI、PPP、等等 |
物理層 |
例如銅纜、網(wǎng)線、光纜、無(wú)線電等等 |
TCP/IP協(xié)議是Internet互聯(lián)網(wǎng)最基本的協(xié)議,其在一定程度上參考了七層ISO模型。OSI模型共有七層,從下到上分別是物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層、運(yùn)輸層、會(huì)話層、表示層和應(yīng)用層。但是這顯然是有些復(fù)雜的,所以在TCP/IP協(xié)議中,七層被簡(jiǎn)化為了四個(gè)層次。TCP/IP模型中的各種協(xié)議,依其功能不同,被分別歸屬到這四層之中,常被視為是簡(jiǎn)化過(guò)后的七層OSI模型。
TCP/IP協(xié)議與七層ISO模型的對(duì)應(yīng)關(guān)系
TCP/IP協(xié)議與七層ISO模型的對(duì)應(yīng)關(guān)系,大致如下圖所示:

TCP/IP協(xié)議的應(yīng)用層的主要協(xié)議有HTTP、Telnet、FTP、SMTP等,是用來(lái)讀取來(lái)自傳輸層的數(shù)據(jù)或者將數(shù)據(jù)傳輸寫(xiě)入傳輸層;傳輸層的主要協(xié)議有UDP、TCP,實(shí)現(xiàn)端對(duì)端的數(shù)據(jù)傳輸;網(wǎng)絡(luò)層的主要協(xié)議有ICMP、IP、IGMP,主要負(fù)責(zé)網(wǎng)絡(luò)中數(shù)據(jù)包的傳送等;鏈路層有時(shí)也稱(chēng)作數(shù)據(jù)鏈路層或網(wǎng)絡(luò)接口層,主要協(xié)議有ARP、RARP,通常包括操作系統(tǒng)中的設(shè)備驅(qū)動(dòng)程序和計(jì)算機(jī)中對(duì)應(yīng)的網(wǎng)絡(luò)接口卡,它們一起處理與傳輸媒介(如電纜或其他物理設(shè)備)的物理接口細(xì)節(jié)。
(一)TCP/IP協(xié)議的應(yīng)用層
應(yīng)用層包括所有和應(yīng)用程序協(xié)同工作,并利用基礎(chǔ)網(wǎng)絡(luò)交換應(yīng)用程序的業(yè)務(wù)數(shù)據(jù)的協(xié)議。一些特定的程序被認(rèn)為運(yùn)行在這個(gè)層上,該層協(xié)議所提供的服務(wù)能直接支持用戶(hù)應(yīng)用。應(yīng)用層協(xié)議包括HTTP(萬(wàn)維網(wǎng)服務(wù))、FTP(文件傳輸)、SMTP(電子郵件)、SSH(安全遠(yuǎn)程登陸)、DNS(域名解析)以及許多其他協(xié)議。
(二)TCP/IP協(xié)議的傳輸層
傳輸層的協(xié)議,解決了諸如端到端可靠性問(wèn)題,能確保數(shù)據(jù)可靠的到達(dá)目的地,甚至能保證數(shù)據(jù)按照正確的順序到達(dá)目的地。傳輸層的主要功能大致如下:
(1)為端到端連接提供傳輸服務(wù);
(2)這種傳輸服務(wù)分為可靠和不可靠的,其中TCP是典型的可靠傳輸,而UDP則是不可靠傳輸;
(3)為端到端連接提供流量控制、差錯(cuò)控制、QoS(Quality of Service)服務(wù)質(zhì)量等管理服務(wù)。
傳輸層主要有兩個(gè)性質(zhì)不同的協(xié)議:TCP傳輸控制協(xié)議和UDP用戶(hù)數(shù)據(jù)報(bào)協(xié)議。
TCP協(xié)議是一個(gè)面向連接的、可靠的傳輸協(xié)議,它提供一種可靠的字節(jié)流,能保證數(shù)據(jù)完整、無(wú)損并且按順序到達(dá)。TCP盡量連續(xù)不斷地測(cè)試網(wǎng)絡(luò)的負(fù)載并且控制發(fā)送數(shù)據(jù)的速度以避免網(wǎng)絡(luò)過(guò)載。另外,TCP試圖將數(shù)據(jù)按照規(guī)定的順序發(fā)送。
UDP協(xié)議是一個(gè)無(wú)連接的數(shù)據(jù)報(bào)協(xié)議,是一個(gè)“盡力傳遞”和“不可靠”協(xié)議,不會(huì)對(duì)數(shù)據(jù)包是否已經(jīng)到達(dá)目的地進(jìn)行檢查,并且不保證數(shù)據(jù)包按順序到達(dá)。
總體來(lái)說(shuō),TCP協(xié)議傳輸效率低,但可靠性強(qiáng);UDP協(xié)議傳輸效率高,但可靠性略低,適用于傳輸可靠性要求不高、體量小的數(shù)據(jù)(比如QQ聊天數(shù)據(jù))。
(三)TCP/IP協(xié)議的網(wǎng)絡(luò)層
TCP/IP協(xié)議網(wǎng)絡(luò)層的作用是在復(fù)雜的網(wǎng)絡(luò)環(huán)境中為要發(fā)送的數(shù)據(jù)報(bào)找到一個(gè)合適的路徑進(jìn)行傳輸。簡(jiǎn)單來(lái)說(shuō),網(wǎng)絡(luò)層負(fù)責(zé)將數(shù)據(jù)傳輸?shù)侥繕?biāo)地址,目標(biāo)地址可以是多個(gè)網(wǎng)絡(luò)通過(guò)路由器連接而成的某一個(gè)地址。另外,網(wǎng)絡(luò)層負(fù)責(zé)尋找合適的路徑到達(dá)對(duì)方計(jì)算機(jī),并把數(shù)據(jù)幀傳送給對(duì)方,網(wǎng)絡(luò)層還可以實(shí)現(xiàn)擁塞控制、網(wǎng)際互連等功能。網(wǎng)絡(luò)層協(xié)議的代表包括:ICMP、IP、IGMP等。
(四)TCP/IP協(xié)議的鏈路層
鏈路層有時(shí)也稱(chēng)作數(shù)據(jù)鏈路層或網(wǎng)絡(luò)接口層,用來(lái)處理連接網(wǎng)絡(luò)的硬件部分。該層既包括操作系統(tǒng)硬件的設(shè)備驅(qū)動(dòng)、NIC(網(wǎng)卡)、光纖等物理可見(jiàn)部分,還包括連接器等一切傳輸媒介。在這一層,數(shù)據(jù)的傳輸單位為比特。其主要協(xié)議有ARP、RARP等。
???♂? 圖解 物理層:使用MAC解決設(shè)備的身份證問(wèn)題
通信的原始時(shí)代
你是一臺(tái)電腦,你的名字叫 A
很久很久之前,你不與任何其他電腦相連接,孤苦伶仃。
直到有一天,你希望與另一臺(tái)電腦 B 建立通信,于是你們各開(kāi)了一個(gè)網(wǎng)口,用一根網(wǎng)線連接了起來(lái)。
用一根網(wǎng)線連接起來(lái)怎么就能"通信"了呢?我可以給你講 IO、講中斷、講緩沖區(qū),但這不是研究網(wǎng)絡(luò)時(shí)該關(guān)心的問(wèn)題。
如果你糾結(jié),要么去研究一下操作系統(tǒng)是如何處理網(wǎng)絡(luò) IO 的,要么去研究一下包是如何被網(wǎng)卡轉(zhuǎn)換成電信號(hào)發(fā)送出去的,要么就僅僅把它當(dāng)做電腦里有個(gè)小人在開(kāi)槍吧~
反正,你們就是連起來(lái)了,并且可以通信。
有一天,一個(gè)新伙伴 C 加入了,但聰明的你們很快發(fā)現(xiàn),可以每個(gè)人開(kāi)兩個(gè)網(wǎng)口,用一共三根網(wǎng)線,彼此相連。
隨著越來(lái)越多的人加入,你發(fā)現(xiàn)身上開(kāi)的網(wǎng)口實(shí)在太多了,而且網(wǎng)線密密麻麻,混亂不堪。(而實(shí)際上一臺(tái)電腦根本開(kāi)不了這么多網(wǎng)口,所以這種連線只在理論上可行,所以連不上的我就用紅色虛線表示了,就是這么嚴(yán)謹(jǐn)哈哈~)
集線器的誕生
于是你們發(fā)明了一個(gè)中間設(shè)備,你們將網(wǎng)線都插到這個(gè)設(shè)備上,由這個(gè)設(shè)備做轉(zhuǎn)發(fā),就可以彼此之間通信了,本質(zhì)上和原來(lái)一樣,只不過(guò)網(wǎng)口的數(shù)量和網(wǎng)線的數(shù)量減少了,不再那么混亂。
你給它取名叫集線器,它僅僅是無(wú)腦將電信號(hào)轉(zhuǎn)發(fā)到所有出口(廣播),不做任何處理,你覺(jué)得它是沒(méi)有智商的,因此把人家定性在了物理層。
由于轉(zhuǎn)發(fā)到了所有出口,那 BCDE 四臺(tái)機(jī)器怎么知道數(shù)據(jù)包是不是發(fā)給自己的呢?
首先,你要給所有的連接到交換機(jī)的設(shè)備,都起個(gè)名字。原來(lái)你們叫 ABCD,但現(xiàn)在需要一個(gè)更專(zhuān)業(yè)的,全局唯一的名字作為標(biāo)識(shí),你把這個(gè)更高端的名字稱(chēng)為?MAC 地址。
你的 MAC 地址是 aa-aa-aa-aa-aa-aa,你的伙伴 b 的 MAC 地址是 bb-bb-bb-bb-bb-bb,以此類(lèi)推,不重復(fù)就好。
這樣,A 在發(fā)送數(shù)據(jù)包給 B 時(shí),只要在頭部拼接一個(gè)這樣結(jié)構(gòu)的數(shù)據(jù),就可以了。
B 在收到數(shù)據(jù)包后,根據(jù)頭部的目標(biāo) MAC 地址信息,判斷這個(gè)數(shù)據(jù)包的確是發(fā)給自己的,于是便收下。
其他的 CDE 收到數(shù)據(jù)包后,根據(jù)頭部的目標(biāo) MAC 地址信息,判斷這個(gè)數(shù)據(jù)包并不是發(fā)給自己的,于是便丟棄。
雖然集線器使整個(gè)布局干凈不少,但原來(lái)我只要發(fā)給電腦 B 的消息,現(xiàn)在卻要發(fā)給連接到集線器中的所有電腦,這樣既不安全,又不節(jié)省網(wǎng)絡(luò)資源。
???♂? 圖解 數(shù)據(jù)鏈路:使用交換機(jī)解決MAC 地址映射問(wèn)題
集線器的問(wèn)題
如果把這個(gè)集線器弄得更智能一些,只發(fā)給目標(biāo) MAC 地址指向的那臺(tái)電腦,就好了。
交換機(jī)的誕生
雖然只比集線器多了這一點(diǎn)點(diǎn)區(qū)別,但看起來(lái)似乎有智能了,你把這東西叫做交換機(jī)。也正因?yàn)檫@一點(diǎn)點(diǎn)智能,你把它放在了另一個(gè)層級(jí),數(shù)據(jù)鏈路層。
如上圖所示,你是這樣設(shè)計(jì)的。
交換機(jī)內(nèi)部維護(hù)一張?MAC 地址表,記錄著每一個(gè) MAC 地址的設(shè)備,連接在其哪一個(gè)端口上。
MAC 地址 |
端口 |
bb-bb-bb-bb-bb-bb |
1 |
cc-cc-cc-cc-cc-cc |
3 |
aa-aa-aa-aa-aa-aa |
4 |
dd-dd-dd-dd-dd-dd |
5 |
假如你仍然要發(fā)給 B 一個(gè)數(shù)據(jù)包,構(gòu)造了如下的數(shù)據(jù)結(jié)構(gòu)從網(wǎng)口出去。
到達(dá)交換機(jī)時(shí),交換機(jī)內(nèi)部通過(guò)自己維護(hù)的 MAC 地址表,發(fā)現(xiàn)目標(biāo)機(jī)器 B 的 MAC 地址 bb-bb-bb-bb-bb-bb 映射到了端口 1 上,于是把數(shù)據(jù)從 1 號(hào)端口發(fā)給了 B,完事~
你給這個(gè)通過(guò)這樣傳輸方式而組成的小范圍的網(wǎng)絡(luò),叫做以太網(wǎng)。
當(dāng)然最開(kāi)始的時(shí)候,MAC 地址表是空的,是怎么逐步建立起來(lái)的呢?
假如在 MAC 地址表為空是,你給 B 發(fā)送了如下數(shù)據(jù)
由于這個(gè)包從端口 4 進(jìn)入的交換機(jī),所以此時(shí)交換機(jī)就可以在 MAC地址表記錄第一條數(shù)據(jù):
MAC:aa-aa-aa-aa-aa-aa-aa
端口:4
交換機(jī)看目標(biāo) MAC 地址(bb-bb-bb-bb-bb-bb)在地址表中并沒(méi)有映射關(guān)系,于是將此包發(fā)給了所有端口,也即發(fā)給了所有機(jī)器。
之后,只有機(jī)器 B 收到了確實(shí)是發(fā)給自己的包,于是做出了響應(yīng),響應(yīng)數(shù)據(jù)從端口 1 進(jìn)入交換機(jī),于是交換機(jī)此時(shí)在地址表中更新了第二條數(shù)據(jù):
MAC:bb-bb-bb-bb-bb-bb
端口:1
過(guò)程如下:
經(jīng)過(guò)該網(wǎng)絡(luò)中的機(jī)器不斷地通信,交換機(jī)最終將 MAC 地址表建立完畢~
隨著機(jī)器數(shù)量越多,交換機(jī)的端口也不夠了,但聰明的你發(fā)現(xiàn),只要將多個(gè)交換機(jī)連接起來(lái),這個(gè)問(wèn)題就輕而易舉搞定~
你完全不需要設(shè)計(jì)額外的東西,只需要按照之前的設(shè)計(jì)和規(guī)矩來(lái),按照上述的接線方式即可完成所有電腦的互聯(lián),所以交換機(jī)設(shè)計(jì)的這種規(guī)則,真的很巧妙。你想想看為什么(比如 A 要發(fā)數(shù)據(jù)給 F)。
但是你要注意,上面那根紅色的線,最終在 MAC 地址表中可不是一條記錄呀,而是要把 EFGH 這四臺(tái)機(jī)器與該端口(端口6)的映射全部記錄在表中。
MAC 地址和端口的映射記錄
最終,兩個(gè)交換機(jī)將分別記錄 A ~ H 所有機(jī)器的映射記錄。
左邊的交換機(jī)
MAC 地址 |
端口 |
bb-bb-bb-bb-bb-bb |
1 |
cc-cc-cc-cc-cc-cc |
3 |
aa-aa-aa-aa-aa-aa |
4 |
dd-dd-dd-dd-dd-dd |
5 |
ee-ee-ee-ee-ee-ee |
6 |
ff-ff-ff-ff-ff-ff |
6 |
gg-gg-gg-gg-gg-gg |
6 |
hh-hh-hh-hh-hh-hh |
6 |
右邊的交換機(jī)
MAC 地址 |
端口 |
bb-bb-bb-bb-bb-bb |
1 |
cc-cc-cc-cc-cc-cc |
1 |
aa-aa-aa-aa-aa-aa |
1 |
dd-dd-dd-dd-dd-dd |
1 |
ee-ee-ee-ee-ee-ee |
2 |
ff-ff-ff-ff-ff-ff |
3 |
gg-gg-gg-gg-gg-gg |
4 |
hh-hh-hh-hh-hh-hh |
6 |
這在只有 8 臺(tái)電腦的時(shí)候還好,甚至在只有幾百臺(tái)電腦的時(shí)候,都還好,所以這種交換機(jī)的設(shè)計(jì)方式,已經(jīng)足足支撐一陣子了。
但很遺憾,人是貪婪的動(dòng)物,很快,電腦的數(shù)量就發(fā)展到幾千、幾萬(wàn)、幾十萬(wàn)。
???♂? 圖解 傳輸層:IP地址和路由器
二層交換機(jī)的問(wèn)題
交換機(jī)已經(jīng)無(wú)法記錄如此龐大的映射關(guān)系了。
此時(shí)你動(dòng)了歪腦筋,你發(fā)現(xiàn)了問(wèn)題的根本在于,連出去的那根紅色的網(wǎng)線,后面不知道有多少個(gè)設(shè)備不斷地連接進(jìn)來(lái),從而使得地址表越來(lái)越大。
那我可不可以讓那根紅色的網(wǎng)線,接入一個(gè)新的設(shè)備,這個(gè)設(shè)備就跟電腦一樣有自己獨(dú)立的 MAC 地址,而且同時(shí)還能幫我把數(shù)據(jù)包做一次轉(zhuǎn)發(fā)呢?
這個(gè)設(shè)備就是路由器,它的功能就是,作為一臺(tái)獨(dú)立的擁有 MAC 地址的設(shè)備,并且可以幫我把數(shù)據(jù)包做一次轉(zhuǎn)發(fā),你把它定在了網(wǎng)絡(luò)層。
注意,路由器的每一個(gè)端口,都有獨(dú)立的 MAC 地址
好了,現(xiàn)在交換機(jī)的 MAC 地址表中,只需要多出一條 MAC 地址 ABAB 與其端口的映射關(guān)系,就可以成功把數(shù)據(jù)包轉(zhuǎn)交給路由器了,這條搞定。
那如何做到,把發(fā)送給 C 和 D,甚至是把發(fā)送給 DEFGH.... 的數(shù)據(jù)包,統(tǒng)統(tǒng)先發(fā)送給路由器呢?
不難想到這樣一個(gè)點(diǎn)子,假如電腦 C 和 D 的 MAC 地址擁有共同的前綴,比如分別是
C 的 MAC 地址:FFFF-FFFF-CCCC?D 的 MAC 地址:FFFF-FFFF-DDDD
那我們就可以說(shuō),將目標(biāo) MAC 地址為?FFFF-FFFF-?開(kāi)頭的,統(tǒng)統(tǒng)先發(fā)送給路由器。
這樣是否可行呢?答案是否定的。
IP地址的誕生
我們先從現(xiàn)實(shí)中 MAC 地址的結(jié)構(gòu)入手,MAC地址也叫物理地址、硬件地址,長(zhǎng)度為 48 位,一般這樣來(lái)表示
00-16-EA-AE-3C-40
它是由網(wǎng)絡(luò)設(shè)備制造商生產(chǎn)時(shí)燒錄在網(wǎng)卡的EPROM(一種閃存芯片,通常可以通過(guò)程序擦寫(xiě))。
其中前 24 位(00-16-EA)代表網(wǎng)絡(luò)硬件制造商的編號(hào),后 24 位(AE-3C-40)是該廠家自己分配的,一般表示系列號(hào)。
只要不更改自己的 MAC 地址,MAC 地址在世界是唯一的。形象地說(shuō),MAC地址就如同身份證上的身份證號(hào)碼,具有唯一性。
那如果你希望向上面那樣表示將目標(biāo) MAC 地址為?FFFF-FFFF-?開(kāi)頭的,統(tǒng)一從路由器出去發(fā)給某一群設(shè)備(后面會(huì)提到這其實(shí)是子網(wǎng)的概念),那你就需要要求某一子網(wǎng)下統(tǒng)統(tǒng)買(mǎi)一個(gè)廠商制造的設(shè)備,要么你就需要要求廠商在生產(chǎn)網(wǎng)絡(luò)設(shè)備燒錄 MAC 地址時(shí),提前按照你規(guī)劃好的子網(wǎng)結(jié)構(gòu)來(lái)定 MAC 地址,并且日后這個(gè)網(wǎng)絡(luò)的結(jié)構(gòu)都不能輕易改變。
這顯然是不現(xiàn)實(shí)的。
于是你發(fā)明了一個(gè)新的地址,給每一臺(tái)機(jī)器一個(gè) 32 位的編號(hào),如:
11000000101010000000000000000001
你覺(jué)得有些不清晰,于是把它分成四個(gè)部分,中間用點(diǎn)相連。
11000000.10101000.00000000.00000001
你還覺(jué)得不清晰,于是把它轉(zhuǎn)換成 10 進(jìn)制。
192.168.0.1
最后你給了這個(gè)地址一個(gè)響亮的名字,IP 地址?,F(xiàn)在每一臺(tái)電腦,同時(shí)有自己的 MAC 地址,又有自己的 IP 地址,只不過(guò) IP 地址是軟件層面上的,可以隨時(shí)修改,MAC 地址一般是無(wú)法修改的。
這樣一個(gè)可以隨時(shí)修改的 IP 地址,就可以根據(jù)你規(guī)劃的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),來(lái)調(diào)整了。
如上圖所示,假如我想要發(fā)送數(shù)據(jù)包給 ABCD 其中一臺(tái)設(shè)備,不論哪一臺(tái),我都可以這樣描述,"將 IP 地址為 192.168.0 開(kāi)頭的全部發(fā)送給到路由器,之后再怎么轉(zhuǎn)發(fā),交給它!",巧妙吧。
路由器的誕生
路由器誕生了,專(zhuān)門(mén)負(fù)責(zé)IP地址的尋找。那報(bào)文交給路由器之后,路由器又是怎么把數(shù)據(jù)包準(zhǔn)確轉(zhuǎn)發(fā)給指定設(shè)備的呢?
別急我們慢慢來(lái)。
我們先給上面的組網(wǎng)方式中的每一臺(tái)設(shè)備,加上自己的 IP 地址
現(xiàn)在兩個(gè)設(shè)備之間傳輸,除了加上數(shù)據(jù)鏈路層的頭部之外,還要再增加一個(gè)網(wǎng)絡(luò)層的頭部。
假如 A 給 B 發(fā)送數(shù)據(jù),由于它們直接連著交換機(jī),所以 A 直接發(fā)出如下數(shù)據(jù)包即可,其實(shí)網(wǎng)絡(luò)層沒(méi)有體現(xiàn)出作用。
但假如 A 給 C 發(fā)送數(shù)據(jù),A 就需要先轉(zhuǎn)交給路由器,然后再由路由器轉(zhuǎn)交給 C。由于最底層的傳輸仍然需要依賴(lài)以太網(wǎng),所以數(shù)據(jù)包是分成兩段的。
A ~ 路由器這段的包如下:
路由器到 C 這段的包如下:
好了,上面說(shuō)的兩種情況(A->B,A->C),相信細(xì)心的讀者應(yīng)該會(huì)有不少疑問(wèn),下面我們一個(gè)個(gè)來(lái)展開(kāi)。
子網(wǎng)的由來(lái)
A 給 C 發(fā)數(shù)據(jù)包,怎么知道是否要通過(guò)路由器轉(zhuǎn)發(fā)呢?
答案:子網(wǎng)
如果源 IP 與目的 IP 處于一個(gè)子網(wǎng),直接將包通過(guò)交換機(jī)發(fā)出去。
如果源 IP 與目的 IP 不處于一個(gè)子網(wǎng),就交給路由器去處理。
好,那現(xiàn)在只需要解決,什么叫處于一個(gè)子網(wǎng)就好了。
- 192.168.0.1 和 192.168.0.2 處于同一個(gè)子網(wǎng)
- 192.168.0.1 和 192.168.1.1 處于不同子網(wǎng)
這兩個(gè)是我們?nèi)藶橐?guī)定的,即我們想表示,對(duì)于 192.168.0.1 來(lái)說(shuō):
192.168.0.xxx 開(kāi)頭的,就算是在一個(gè)子網(wǎng),否則就是在不同的子網(wǎng)。
那對(duì)于計(jì)算機(jī)來(lái)說(shuō),怎么表達(dá)這個(gè)意思呢?于是人們發(fā)明了子網(wǎng)掩碼的概念
假如某臺(tái)機(jī)器的子網(wǎng)掩碼定為 255.255.255.0
這表示,將源 IP 與目的 IP 分別同這個(gè)子網(wǎng)掩碼進(jìn)行與運(yùn)算****,相等則是在一個(gè)子網(wǎng),不相等就是在不同子網(wǎng),就這么簡(jiǎn)單。
比如
- A電腦:192.168.0.1 & 255.255.255.0 = 192.168.0.0
- B電腦:192.168.0.2 & 255.255.255.0 = 192.168.0.0
- C電腦:192.168.1.1 & 255.255.255.0 = 192.168.1.0
- D電腦:192.168.1.2 & 255.255.255.0 = 192.168.1.0
那么 A 與 B 在同一個(gè)子網(wǎng),C 與 D 在同一個(gè)子網(wǎng),但是 A 與 C 就不在同一個(gè)子網(wǎng),與 D 也不在同一個(gè)子網(wǎng),以此類(lèi)推。
所以如果 A 給 C 發(fā)消息,A 和 C 的 IP 地址分別 & A 機(jī)器配置的子網(wǎng)掩碼,發(fā)現(xiàn)不相等,則 A 認(rèn)為 C 和自己不在同一個(gè)子網(wǎng),于是把包發(fā)給路由器,就不管了,之后怎么轉(zhuǎn)發(fā),A 不關(guān)心。
A 如何知道,哪個(gè)設(shè)備是路由器?
答案:在 A 上要設(shè)置默認(rèn)網(wǎng)關(guān)
上一步 A 通過(guò)是否與 C 在同一個(gè)子網(wǎng)內(nèi),判斷出自己應(yīng)該把包發(fā)給路由器,那路由器的 IP 是多少呢?
其實(shí)說(shuō)發(fā)給路由器不準(zhǔn)確,應(yīng)該說(shuō) A 會(huì)把包發(fā)給默認(rèn)網(wǎng)關(guān)。
對(duì) A 來(lái)說(shuō),A 只能直接把包發(fā)給同處于一個(gè)子網(wǎng)下的某個(gè) IP 上,所以發(fā)給路由器還是發(fā)給某個(gè)電腦,對(duì) A 來(lái)說(shuō)也不關(guān)心,只要這個(gè)設(shè)備有個(gè) IP 地址就行。
所以默認(rèn)網(wǎng)關(guān),就是 A 在自己電腦里配置的一個(gè) IP 地址,以便在發(fā)給不同子網(wǎng)的機(jī)器時(shí),發(fā)給這個(gè) IP 地址。
僅此而已!
路由表的由來(lái)(和Mac表的由來(lái)好像,都是逼出來(lái)的)
路由器如何知道C在哪里?
答案:路由表
現(xiàn)在 A 要給 C 發(fā)數(shù)據(jù)包,已經(jīng)可以成功發(fā)到路由器這里了,最后一個(gè)問(wèn)題就是,路由器怎么知道,收到的這個(gè)數(shù)據(jù)包,該從自己的哪個(gè)端口出去,才能直接(或間接)地最終到達(dá)目的地 C 呢。
路由器收到的數(shù)據(jù)包有目的 IP 也就是 C 的 IP 地址,需要轉(zhuǎn)化成從自己的哪個(gè)端口出去,很容易想到,應(yīng)該有個(gè)表,就像 MAC 地址表一樣。
這個(gè)表就叫路由表。
至于這個(gè)路由表是怎么出來(lái)的,有很多路由算法,本文不展開(kāi),因?yàn)槲乙膊粫?huì)哈哈~
不同于 MAC 地址表的是,路由表并不是一對(duì)一這種明確關(guān)系,我們下面看一個(gè)路由表的結(jié)構(gòu)。
目的地址 |
子網(wǎng)掩碼 |
下一跳 |
端口 |
192.168.0.0 |
255.255.255.0 |
0 |
|
192.168.0.254 |
255.255.255.255 |
0 |
|
192.168.1.0 |
255.255.255.0 |
1 |
|
192.168.1.254 |
255.255.255.255 |
1 |
我們學(xué)習(xí)一種新的表示方法,由于子網(wǎng)掩碼其實(shí)就表示前多少位表示子網(wǎng)的網(wǎng)段,所以如192.168.0.0(255.255.255.0) 也可以簡(jiǎn)寫(xiě)為 192.168.0.0/24
目的地址 |
下一跳 |
端口 |
192.168.0.0/24 |
0 |
|
192.168.0.254/32 |
0 |
|
192.168.1.0/24 |
1 |
|
192.168.1.254/32 |
1 |
這就很好理解了,路由表就表示,192.168.0.xxx 這個(gè)子網(wǎng)下的,都轉(zhuǎn)發(fā)到 0 號(hào)端口,192.168.1.xxx 這個(gè)子網(wǎng)下的,都轉(zhuǎn)發(fā)到 1 號(hào)端口。下一跳列還沒(méi)有值,我們先不管
配合著結(jié)構(gòu)圖來(lái)看(這里把子網(wǎng)掩碼和默認(rèn)網(wǎng)關(guān)都補(bǔ)齊了)
剛才說(shuō)的都是 IP 層,但發(fā)送數(shù)據(jù)包的數(shù)據(jù)鏈路層需要知道 MAC 地址,可是我只知道 IP 地址該怎么辦呢?
答案:arp
假如你(A)此時(shí)不知道你同伴 B 的 MAC 地址(現(xiàn)實(shí)中就是不知道的,剛剛我們只是假設(shè)已知),你只知道它的 IP 地址,你該怎么把數(shù)據(jù)包準(zhǔn)確傳給 B 呢?
答案很簡(jiǎn)單,在網(wǎng)絡(luò)層,我需要把 IP 地址對(duì)應(yīng)的 MAC 地址找到,也就是通過(guò)某種方式,找到?192.168.0.2?對(duì)應(yīng)的 MAC 地址?BBBB。
這種方式就是?arp 協(xié)議,同時(shí)電腦 A 和 B 里面也會(huì)有一張?arp 緩存表,表中記錄著?IP 與 MAC 地址的對(duì)應(yīng)關(guān)系。
IP 地址 |
MAC 地址 |
192.168.0.2 |
BBBB |
一開(kāi)始的時(shí)候這個(gè)表是空的,電腦 A 為了知道電腦 B(192.168.0.2)的 MAC 地址,將會(huì)廣播一條 arp 請(qǐng)求,B 收到請(qǐng)求后,帶上自己的 MAC 地址給 A 一個(gè)響應(yīng)。此時(shí) A 便更新了自己的 arp 表。
這樣通過(guò)大家不斷廣播 arp 請(qǐng)求,最終所有電腦里面都將 arp 緩存表更新完整。
???♂? 圖解:整個(gè)傳輸過(guò)程
好了,總結(jié)一下,到目前為止就幾條規(guī)則
從各個(gè)節(jié)點(diǎn)的視角來(lái)看
電腦視角
- 首先我要知道我的 IP 以及對(duì)方的 IP
- 通過(guò)子網(wǎng)掩碼判斷我們是否在同一個(gè)子網(wǎng)
- 在同一個(gè)子網(wǎng)就通過(guò) arp 獲取對(duì)方 mac 地址直接扔出去
- 不在同一個(gè)子網(wǎng)就通過(guò) arp 獲取默認(rèn)網(wǎng)關(guān)的 mac 地址直接扔出去
交換機(jī)視角
- 我收到的數(shù)據(jù)包必須有目標(biāo) MAC 地址
- 通過(guò) MAC 地址表查映射關(guān)系
- 查到了就按照映射關(guān)系從我的指定端口發(fā)出去
- 查不到就所有端口都發(fā)出去
路由器視角
- 我收到的數(shù)據(jù)包必須有目標(biāo) IP 地址
- 通過(guò)路由表查映射關(guān)系
- 查到了就按照映射關(guān)系從我的指定端口發(fā)出去(不在任何一個(gè)子網(wǎng)范圍,走其路由器的默認(rèn)網(wǎng)關(guān)也是查到了)
- 查不到則返回一個(gè)路由不可達(dá)的數(shù)據(jù)包
如果你嗅覺(jué)足夠敏銳,你應(yīng)該可以感受到下面這句話:
網(wǎng)絡(luò)層(IP協(xié)議)本身沒(méi)有傳輸包的功能,包的實(shí)際傳輸是委托給數(shù)據(jù)鏈路層(以太網(wǎng)中的交換機(jī))來(lái)實(shí)現(xiàn)的。
涉及到的三張表分別是
- 交換機(jī)中有?MAC 地址表用于映射 MAC 地址和它的端口
- 路由器中有路由表用于映射 IP 地址(段)和它的端口
- 電腦和路由器中都有** arp 緩存表**用于緩存 IP 和 MAC 地址的映射關(guān)系
這三張表是怎么來(lái)的
- MAC 地址表是通過(guò)以太網(wǎng)內(nèi)各節(jié)點(diǎn)之間不斷通過(guò)交換機(jī)通信,不斷完善起來(lái)的。
- 路由表是各種路由算法 + 人工配置逐步完善起來(lái)的。
- arp 緩存表是不斷通過(guò) arp 協(xié)議的請(qǐng)求逐步完善起來(lái)的。?
知道了以上這些,目前網(wǎng)絡(luò)上兩個(gè)節(jié)點(diǎn)是如何發(fā)送數(shù)據(jù)包的這個(gè)過(guò)程,就完全可以解釋通了!
參考的網(wǎng)絡(luò)拓?fù)鋱D
那接下來(lái)我們就放上參考的?最后一個(gè)網(wǎng)絡(luò)拓?fù)鋱D吧,請(qǐng)做好?戰(zhàn)斗?準(zhǔn)備!
這時(shí)路由器 1 連接了路由器 2,所以其路由表有了下一條地址這一個(gè)概念,所以它的路由表就變成了這個(gè)樣子。如果匹配到了有下一跳地址的一項(xiàng),則需要再次匹配,找到其端口,并找到下一跳 IP 的 MAC 地址。
也就是說(shuō)找來(lái)找去,最終必須能映射到一個(gè)端口號(hào),然后從這個(gè)端口號(hào)把數(shù)據(jù)包發(fā)出去。
目的地址 |
下一跳 |
端口 |
192.168.0.0/24 |
0 |
|
192.168.0.254/32 |
0 |
|
192.168.1.0/24 |
1 |
|
192.168.1.254/32 |
1 |
|
192.168.2.0/24 |
192.168.100.5 |
|
192.168.100.0/24 |
2 |
|
192.168.100.4/32 |
2 |
這時(shí)如果 A 給 F 發(fā)送一個(gè)數(shù)據(jù)包,能不能通呢?如果通的話整個(gè)過(guò)程是怎樣的呢?
思考一分鐘...
詳細(xì)過(guò)程動(dòng)畫(huà)描述:
詳細(xì)過(guò)程文字描述
1.?首先 A(192.168.0.1)通過(guò)子網(wǎng)掩碼(255.255.255.0)計(jì)算出自己與 F(192.168.2.2)并不在同一個(gè)子網(wǎng)內(nèi),于是決定發(fā)送給默認(rèn)網(wǎng)關(guān)(192.168.0.254)
2.?A 通過(guò) ARP 找到 默認(rèn)網(wǎng)關(guān) 192.168.0.254 的 MAC 地址。
3.?A 將源 MAC 地址(AAAA)與網(wǎng)關(guān) MAC 地址(ABAB)封裝在數(shù)據(jù)鏈路層頭部,又將源 IP 地址(192.168.0.1)和目的 IP 地址(192.168.2.2)(注意這里千萬(wàn)不要以為填寫(xiě)的是默認(rèn)網(wǎng)關(guān)的 IP 地址,從始至終這個(gè)數(shù)據(jù)包的兩個(gè) IP 地址都是不變的,只有 MAC 地址在不斷變化)封裝在網(wǎng)絡(luò)層頭部,然后發(fā)包
4.?交換機(jī) 1 收到數(shù)據(jù)包后,發(fā)現(xiàn)目標(biāo) MAC 地址是 ABAB,轉(zhuǎn)發(fā)給路由器1
5.?數(shù)據(jù)包來(lái)到了路由器 1,發(fā)現(xiàn)其目標(biāo) IP 地址是 192.168.2.2,查看其路由表,發(fā)現(xiàn)了下一跳的地址是 192.168.100.5*
6.?所以此時(shí)路由器 1 需要做兩件事,第一件是再次匹配路由表,發(fā)現(xiàn)匹配到了端口為 2,于是將其封裝到數(shù)據(jù)鏈路層,最后把包從 2 號(hào)口發(fā)出去。
7.?此時(shí)路由器 2 收到了數(shù)據(jù)包,看到其目的地址是 192.168.2.2,查詢(xún)其路由表,匹配到端口號(hào)為 1,準(zhǔn)備從 1 號(hào)口把數(shù)據(jù)包送出去。
8.?但此時(shí)路由器 2 需要知道 192.168.2.2 的 MAC 地址了,于是查看其 arp 緩存,找到其 MAC 地址為 FFFF,將其封裝在數(shù)據(jù)鏈路層頭部,并從 1 號(hào)端口把包發(fā)出去。
9.?交換機(jī) 3 收到了數(shù)據(jù)包,發(fā)現(xiàn)目的 MAC 地址為 FFFF,查詢(xún)其 MAC 地址表,發(fā)現(xiàn)應(yīng)該從其 6 號(hào)端口出去,于是從 6 號(hào)端口把數(shù)據(jù)包發(fā)出去。
10.F 最終收到了數(shù)據(jù)包!**并且發(fā)現(xiàn)目的 MAC 地址就是自己,于是收下了這個(gè)包
更詳細(xì)且精準(zhǔn)的過(guò)程:
讀到這相信大家已經(jīng)很累了,理解上述過(guò)程基本上網(wǎng)絡(luò)層以下的部分主流程就基本疏通了,如果你想要本過(guò)程更為專(zhuān)業(yè)的過(guò)程描述,可以在公眾號(hào)"低并發(fā)編程"后臺(tái)回復(fù)"網(wǎng)絡(luò)",獲得我模擬這個(gè)過(guò)程的 Cisco Packet Tracer 源文件。
每一步包的傳輸都會(huì)有各層的原始數(shù)據(jù),以及專(zhuān)業(yè)的過(guò)程描述
同時(shí)在此基礎(chǔ)之上你也可以設(shè)計(jì)自己的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),進(jìn)行各種實(shí)驗(yàn),來(lái)加深網(wǎng)絡(luò)傳輸過(guò)程的理解。
至此,經(jīng)過(guò)物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層這前三層的協(xié)議,以及根據(jù)這些協(xié)議設(shè)計(jì)的各種網(wǎng)絡(luò)設(shè)備(網(wǎng)線、集線器、交換機(jī)、路由器),理論上只要擁有對(duì)方的 IP 地址,就已經(jīng)將地球上任意位置的兩個(gè)節(jié)點(diǎn)連通了。
相關(guān)參考資料:如果讓你來(lái)設(shè)計(jì)網(wǎng)絡(luò),你會(huì)如何設(shè)計(jì)??
???♂? HTTP報(bào)文傳輸原理
利用TCP/IP進(jìn)行網(wǎng)絡(luò)通信時(shí),數(shù)據(jù)包會(huì)按照分層順序與對(duì)方進(jìn)行通信。發(fā)送端從應(yīng)用層往下走,接收端從鏈路層往上走。從客戶(hù)端到服務(wù)器的數(shù)據(jù),每一幀數(shù)據(jù)的傳輸?shù)捻樞蚨紴椋簯?yīng)用層->運(yùn)輸層->網(wǎng)絡(luò)層->鏈路層->鏈路層->網(wǎng)絡(luò)層->運(yùn)輸層->應(yīng)用層。
HTTP報(bào)文傳輸過(guò)程
以一個(gè)HTTP請(qǐng)求的傳輸為例,請(qǐng)求從HTTP客戶(hù)端(如瀏覽器)和HTTP服務(wù)端應(yīng)用的傳輸過(guò)程,大致如下圖所示:

數(shù)據(jù)封裝和分用
接下來(lái),為大家介紹一下數(shù)據(jù)封裝和分用。
數(shù)據(jù)通過(guò)互聯(lián)網(wǎng)傳輸?shù)臅r(shí)候不可能是光禿禿的不加標(biāo)識(shí),如果這樣數(shù)據(jù)就會(huì)亂。所以數(shù)據(jù)在發(fā)送的時(shí)候,需要加上特定標(biāo)識(shí),加上特定標(biāo)識(shí)的過(guò)程叫做數(shù)據(jù)的封裝,在數(shù)據(jù)使用的時(shí)候再去掉特定標(biāo)識(shí),去掉特定標(biāo)識(shí)的過(guò)程就叫做分用。TCP/IP協(xié)議的數(shù)據(jù)封裝和分用過(guò)程,大致如下圖所示:

在數(shù)據(jù)封裝時(shí),數(shù)據(jù)經(jīng)過(guò)每個(gè)層都會(huì)打上該層特定標(biāo)識(shí),添加上頭部。
在傳輸層封裝時(shí),添加的報(bào)文首部時(shí)要存入一個(gè)應(yīng)用程序的標(biāo)識(shí)符,無(wú)論TCP和UDP都用一個(gè)16位的端口號(hào)來(lái)表示不同的應(yīng)用程序,并且都會(huì)將源端口和目的端口存入報(bào)文首部中。
在網(wǎng)絡(luò)層封裝時(shí),IP首部會(huì)標(biāo)識(shí)處理數(shù)據(jù)的協(xié)議類(lèi)型,或者說(shuō)標(biāo)識(shí)出網(wǎng)絡(luò)層數(shù)據(jù)幀所攜帶的上層數(shù)據(jù)類(lèi)型,如TCP、UDP、ICMP、IP、IGMP等等。具體來(lái)說(shuō),會(huì)在IP首部中存入一個(gè)長(zhǎng)度為8位的數(shù)值,稱(chēng)作協(xié)議域:1表示為ICMP協(xié)議、2表示為IGMP協(xié)議、6表示為T(mén)CP協(xié)議、17表示為UDP協(xié)議、等等。IP首部還會(huì)標(biāo)識(shí)發(fā)送方地址(源IP)和接收方地址(目標(biāo)IP)。
在鏈路層封裝時(shí),網(wǎng)絡(luò)接口分別要發(fā)送和接收IP、ARP和RARP等多種不同協(xié)議的報(bào)文,因此也必須在以太網(wǎng)的幀首部中加入某種形式的標(biāo)識(shí),以指明所處理的協(xié)議類(lèi)型,為此,以太網(wǎng)的報(bào)文幀的首部也有一個(gè)16位的類(lèi)型域,標(biāo)識(shí)出以太網(wǎng)數(shù)據(jù)幀所攜帶的上層數(shù)據(jù)類(lèi)型,如IPv4、ARP、IPV6、PPPoE等等。
數(shù)據(jù)封裝和分用的過(guò)程大致為:發(fā)送端每通過(guò)一層會(huì)增加該層的首部,接收端每通過(guò)一層則刪除該層的首部。
總體來(lái)說(shuō),TCP/IP分層管理、數(shù)據(jù)封裝和分用的好處:分層之后若需改變相關(guān)設(shè)計(jì),只需替換變動(dòng)的層。各層之間的接口部分規(guī)劃好之后,每個(gè)層次內(nèi)部的設(shè)計(jì)就可以自由改動(dòng)。層次化之后,設(shè)計(jì)也變得相對(duì)簡(jiǎn)單:各個(gè)層只需考慮分派給自己的傳輸任務(wù)。
TCP/IP與OSI的區(qū)別主要有哪些呢?除了TCP/IP與OSI在分層模塊上稍有區(qū)別,更重要的區(qū)別為:OSI參考模型注重“通信協(xié)議必要的功能是什么”,而TCP/IP則更強(qiáng)調(diào)“在計(jì)算機(jī)上實(shí)現(xiàn)協(xié)議應(yīng)該開(kāi)發(fā)哪種程序”。
實(shí)際上,在傳輸過(guò)程中,數(shù)據(jù)報(bào)文會(huì)在不同的物理網(wǎng)絡(luò)之間傳遞,還是以一個(gè)HTTP請(qǐng)求的傳輸為例,請(qǐng)求在不同物理網(wǎng)絡(luò)之間的傳輸過(guò)程,大致如下圖所示:

數(shù)據(jù)包在不同物理網(wǎng)絡(luò)之間的傳輸過(guò)程中,網(wǎng)絡(luò)層會(huì)通過(guò)路由器去對(duì)不同的網(wǎng)絡(luò)之間的數(shù)據(jù)包進(jìn)行存儲(chǔ)、分組轉(zhuǎn)發(fā)處理。構(gòu)造互連網(wǎng)最簡(jiǎn)單的方法是把兩個(gè)或多個(gè)網(wǎng)絡(luò)通過(guò)路由器進(jìn)行連接。路由器可以簡(jiǎn)單理解為一種特殊的用于網(wǎng)絡(luò)互連的硬件盒,其作用是為不同類(lèi)型的物理網(wǎng)絡(luò)提供連接:以太網(wǎng)、令牌環(huán)網(wǎng)、點(diǎn)對(duì)點(diǎn)的鏈接和FDDI(光纖分布式數(shù)據(jù)接口)等等。
物理網(wǎng)絡(luò)之間通過(guò)路由器進(jìn)行互連,隨著增加不同類(lèi)型的物理網(wǎng)絡(luò),可能會(huì)有很多個(gè)路由器,但是對(duì)于應(yīng)用層來(lái)說(shuō)仍然是一樣的,TCP協(xié)議棧為大家屏蔽了物理層的復(fù)雜性。總之,物理細(xì)節(jié)和差異性的隱藏,使得互聯(lián)網(wǎng)TCP/IP傳輸?shù)墓δ茏兊梅浅?qiáng)大。
接下來(lái),開(kāi)始為大家介紹與傳輸性能有密切關(guān)系的內(nèi)容:TCP傳輸層的三次握手建立連接,四次揮手釋放連接。不過(guò)在此之前,還得先介紹一下TCP報(bào)文協(xié)議。
???♂? TCP協(xié)議的報(bào)文格式
在TCP/IP協(xié)議棧中,IP協(xié)議層只關(guān)心如何使數(shù)據(jù)能夠跨越本地網(wǎng)絡(luò)邊界的問(wèn)題,而不關(guān)心數(shù)據(jù)如何傳輸。整體TCP/IP協(xié)議棧,共同配合一起解決數(shù)據(jù)如何通過(guò)許許多多個(gè)點(diǎn)對(duì)點(diǎn)通路,順利傳輸?shù)竭_(dá)目的地。一個(gè)點(diǎn)對(duì)點(diǎn)通路被稱(chēng)為一“跳”(hop),通過(guò)TCP/IP協(xié)議棧,網(wǎng)絡(luò)成員能夠在許多“跳”的基礎(chǔ)上建立相互的數(shù)據(jù)通路。
傳輸層TCP協(xié)議提供了一種面向連接的、可靠的字節(jié)流服務(wù),其數(shù)據(jù)幀格式,大致如下圖所示:

一個(gè)傳輸層TCP協(xié)議的數(shù)據(jù)幀,大致包含以下字段:
(一)源端口號(hào)
源端口號(hào)表示報(bào)文的發(fā)送端口,占16位。源端口和源IP地址組合起來(lái),可以標(biāo)識(shí)報(bào)文的發(fā)送地址。
(二)目的端口號(hào)
目的端口號(hào)表示報(bào)文的接收端口,占16位。目的端口和目的IP地址相結(jié)合,可以標(biāo)識(shí)報(bào)文的接收地址。
TCP協(xié)議是基于IP協(xié)議的基礎(chǔ)上傳輸?shù)?,TCP報(bào)文中的源端口號(hào)+源IP,與TCP報(bào)文中的目的端口號(hào)+目的IP一起,組合起來(lái)唯一性的確定一條TCP連接。
(三)序號(hào)(Sequence Number)
TCP傳輸過(guò)程中,在發(fā)送端出的字節(jié)流中,傳輸報(bào)文中的數(shù)據(jù)部分的每一個(gè)字節(jié)都有它的編號(hào)。序號(hào)(Sequence Number)占32位,發(fā)起方發(fā)送數(shù)據(jù)時(shí),都需要標(biāo)記序號(hào)。
序號(hào)(Sequence Number)的語(yǔ)義與SYN控制標(biāo)志(Control Bits)的值有關(guān)。根據(jù)控制標(biāo)志(Control Bits)中的SYN是否為1,序號(hào)(Sequence Number)表達(dá)不同的含義:
(1)當(dāng)SYN = 1時(shí),當(dāng)前為連接建立階段,此時(shí)的序號(hào)為初始序號(hào)ISN((Initial Sequence Number),通過(guò)算法來(lái)隨機(jī)生成序號(hào);
(2)當(dāng)SYN = 0時(shí)在數(shù)據(jù)傳輸正式開(kāi)始時(shí),第一個(gè)報(bào)文的序號(hào)為 ISN + 1,后面的報(bào)文的序號(hào),為前一個(gè)報(bào)文的SN值+TCP報(bào)文的凈荷字節(jié)數(shù)(不包含TCP頭)。比如,如果發(fā)送端發(fā)送的一個(gè)TCP幀的凈荷為12byte,序號(hào)為5,則發(fā)送端接著發(fā)送的下一個(gè)數(shù)據(jù)包的時(shí)候,序號(hào)的值應(yīng)該設(shè)置為5+12=17。
在數(shù)據(jù)傳輸過(guò)程中,TCP協(xié)議通過(guò)序號(hào)(Sequence Number)對(duì)上層提供有序的數(shù)據(jù)流。發(fā)送端可以用序號(hào)來(lái)跟蹤發(fā)送的數(shù)據(jù)量;接收端可以用序號(hào)識(shí)別出重復(fù)接收到的TCP包,從而丟棄重復(fù)包;對(duì)于亂序的數(shù)據(jù)包,接收端也可以依靠序號(hào)對(duì)其進(jìn)行排序。
(四)確認(rèn)序號(hào)(Acknowledgment Number)
確認(rèn)序號(hào)(Acknowledgment? Number)標(biāo)識(shí)了報(bào)文接收端期望接收的字節(jié)序列。如果設(shè)置了ACK控制位,確認(rèn)序號(hào)的值表示一個(gè)準(zhǔn)備接收的包的序列碼,注意,它所指向的是準(zhǔn)備接收的包,也就是下一個(gè)期望接收的包的序列碼。
舉個(gè)例子,假設(shè)發(fā)送端(如Client)發(fā)送3個(gè)凈荷為1000byte、起始SN序號(hào)為1的數(shù)據(jù)包給Server服務(wù)端,Server每收到一個(gè)包之后,需要回復(fù)一個(gè)ACK響應(yīng)確認(rèn)數(shù)據(jù)包給Client。ACK響應(yīng)數(shù)據(jù)包的ACK Number值,為每個(gè)Client包的為SN+包凈荷,既表示Server已經(jīng)確認(rèn)收到的字節(jié)數(shù),還表示期望接收到的下一個(gè)Client發(fā)送包的SN序號(hào),具體的ACK值如下圖左邊的正常傳輸部分所示。

在上圖的左邊部分,Server第1個(gè)ACK包的ACK Number值為1001,是通過(guò)Client第1個(gè)包的SN+包凈荷=1+1000計(jì)算得到,表示期望第2個(gè)Client包的SN序號(hào)為1001;Server第2個(gè)ACK包的ACK Number值為2001,為Client第2個(gè)包的SN+包凈荷=2001,表示期望第3個(gè)Server包的SN為2001,以此類(lèi)推。
如果發(fā)生錯(cuò)誤,假設(shè)Server在處理Client的第二個(gè)發(fā)送包異常,Server仍然回復(fù)一個(gè)ACK Number值為1001的確認(rèn)包,則Client的第二個(gè)數(shù)據(jù)包需要重復(fù)發(fā)送,具體的ACK值如上圖右邊的正常傳輸部分所示。
只有控制標(biāo)志的ACK標(biāo)志為1時(shí),數(shù)據(jù)幀中的確認(rèn)序號(hào)ACK Number才有效。TCP協(xié)議規(guī)定,連接建立后,所有發(fā)送的報(bào)文的ACK必須為1,也就是建立連接后,所有報(bào)文的確認(rèn)序號(hào)有效。如果是SYN類(lèi)型的報(bào)文,其ACK標(biāo)志為0,故沒(méi)有確認(rèn)序號(hào)。
(五)頭部長(zhǎng)度
該字段占用4位,用來(lái)表示TCP報(bào)文首部的長(zhǎng)度,單位是4bit位。其值所表示的并不是字節(jié)數(shù),而是頭部的所含有的32bit的數(shù)目(或者倍數(shù)),或者4個(gè)字節(jié)的倍數(shù),所以TCP頭部最多可以有60字節(jié)(4*15=60)。沒(méi)有任何選項(xiàng)字段的TCP頭部長(zhǎng)度為20字節(jié),所以其頭部長(zhǎng)度為5,可以通過(guò)20/4=5計(jì)算得到。
(六)預(yù)留6位
頭部長(zhǎng)度后面預(yù)留的字段長(zhǎng)度為6位,作為保留字段,暫時(shí)沒(méi)有什么用處。
(七)控制標(biāo)志
控制標(biāo)志(Control Bits)共6個(gè)bit位,具體的標(biāo)志位為:URG、ACK、PSH、RST、SYN、FIN。6個(gè)標(biāo)志位的說(shuō)明,如下表所示。
表:TCP報(bào)文控制標(biāo)志(Control Bits)說(shuō)明
標(biāo)志位 |
說(shuō)明 |
URG |
占1位,表示緊急指針字段有效。URG位指示報(bào)文段里的上層實(shí)體(數(shù)據(jù))標(biāo)記為“緊急”數(shù)據(jù)。當(dāng)URG=1時(shí),其后的緊急指針指示緊急數(shù)據(jù)在當(dāng)前數(shù)據(jù)段中的位置(相對(duì)于當(dāng)前序列號(hào)的字節(jié)偏移量),TCP接收方必須通知上層實(shí)體。 |
ACK |
占1位,置位ACK=1表示確認(rèn)號(hào)字段有效;TCP協(xié)議規(guī)定,接建立后所有發(fā)送的報(bào)文的ACK必須為1;當(dāng)ACK=0時(shí),表示該數(shù)據(jù)段不包含確認(rèn)信息。當(dāng)ACK=1時(shí),表示該報(bào)文段包括一個(gè)對(duì)已被成功接收?qǐng)?bào)文段的確認(rèn)序號(hào)Acknowledgment Number,該序號(hào)同時(shí)也是下一個(gè)報(bào)文的預(yù)期序號(hào)。 |
PSH |
占1位,表示當(dāng)前報(bào)文需要請(qǐng)求推(push)操作;當(dāng)PSH=1時(shí),接收方在收到數(shù)據(jù)后立即將數(shù)據(jù)交給上層,而不是直到整個(gè)緩沖區(qū)滿(mǎn)。 |
RST |
占1位,置位RST=1表示復(fù)位TCP連接;用于重置一個(gè)已經(jīng)混亂的連接,也可用于拒絕一個(gè)無(wú)效的數(shù)據(jù)段或者拒絕一個(gè)連接請(qǐng)求。如果數(shù)據(jù)段被設(shè)置了RST位,說(shuō)明報(bào)文發(fā)送方有問(wèn)題發(fā)生。 |
SYN |
占1位,在連接建立時(shí)用來(lái)同步序號(hào)。當(dāng)SYN=1而ACK=0時(shí),表明這是一個(gè)連接請(qǐng)求報(bào)文。對(duì)方若同意建立連接,則應(yīng)在響應(yīng)報(bào)文中使SYN=1和ACK=1。 綜合一下,SYN置1就表示這是一個(gè)連接請(qǐng)求或連接接受報(bào)文。 |
FIN |
占1位,用于在釋放TCP連接時(shí),標(biāo)識(shí)發(fā)送方比特流結(jié)束,用來(lái)釋放一個(gè)連接。當(dāng) FIN = 1時(shí),表明此報(bào)文的發(fā)送方的數(shù)據(jù)已經(jīng)發(fā)送完畢,并要求釋放連接。 |
在連接建立的三次握手過(guò)程中,若只是單個(gè)SYN置位,表示的只是建立連接請(qǐng)求。如果SYN和ACK同時(shí)置位為1,表示的建立連接之后的響應(yīng)。
(八)窗口大小
長(zhǎng)度為16位,共2個(gè)字節(jié)。此字段用來(lái)進(jìn)行流量控制。流量控制的單位為字節(jié)數(shù),這個(gè)值是本端期望一次接收的字節(jié)數(shù)。
(九)校驗(yàn)和計(jì)算
長(zhǎng)度為16位,共2個(gè)字節(jié)。對(duì)整個(gè)TCP報(bào)文段,即TCP頭部和TCP數(shù)據(jù)進(jìn)行校驗(yàn)和計(jì)算,接收端用于對(duì)收到的數(shù)據(jù)包進(jìn)行驗(yàn)證。
(十)緊急指針
長(zhǎng)度為16米,2個(gè)字節(jié)。它是一個(gè)偏移量,和SN序號(hào)值相加表示緊急數(shù)據(jù)最后一個(gè)字節(jié)的序號(hào)。
以上十項(xiàng)內(nèi)容是TCP報(bào)文首部必須的字段,也稱(chēng)固有字段,長(zhǎng)度為20個(gè)字節(jié)。接下來(lái)是TCP報(bào)文的可選項(xiàng)和填充部分。
(十一)可選項(xiàng)和填充部分
可選項(xiàng)和填充部分的長(zhǎng)度為4n字節(jié)(n是整數(shù)),該部分是根據(jù)需要而增加的選項(xiàng)。如果不足4n字節(jié),要加填充位,使得選項(xiàng)長(zhǎng)度為32位(4字節(jié))的整數(shù)倍,具體的做法是在這個(gè)字段中加入額外的零,以確保TCP頭是32位(4字節(jié))的整數(shù)倍。
最常見(jiàn)的選項(xiàng)字段是MSS(Maximum Segment Size最長(zhǎng)報(bào)文大小),每個(gè)連接方通常都在通信的第一個(gè)報(bào)文段(SYN標(biāo)志為1的那個(gè)段)中指明這個(gè)選項(xiàng)字段,表示當(dāng)前連接方所能接受的最大報(bào)文段的長(zhǎng)度。
由于可選項(xiàng)和填充部分不是必須的,所以TCP報(bào)文首部最小長(zhǎng)度為20個(gè)字節(jié)。
至此,TCP報(bào)文首部的字段,就全部介紹完了。TCP報(bào)文首部的后面,接著的是數(shù)據(jù)部分,不過(guò)數(shù)據(jù)部分是可選的。在一個(gè)連接建立和一個(gè)連接終止時(shí),雙方交換的報(bào)文段僅有TCP首部。如果一方?jīng)]有數(shù)據(jù)要發(fā)送,也使用沒(méi)有任何數(shù)據(jù)的首部來(lái)確認(rèn)收到的數(shù)據(jù),比如在處理超時(shí)的過(guò)程中,也會(huì)發(fā)送不帶任何數(shù)據(jù)的報(bào)文段。
總體來(lái)說(shuō),TCP協(xié)議的可靠性,主要通過(guò)以下幾點(diǎn)來(lái)保障:
(1)應(yīng)用數(shù)據(jù)分割成TCP認(rèn)為最適合發(fā)送的數(shù)據(jù)塊。這部分是通過(guò)MSS(最大數(shù)據(jù)包長(zhǎng)度)選項(xiàng)來(lái)控制的,通常這種機(jī)制也被稱(chēng)為一種協(xié)商機(jī)制,MSS規(guī)定了TCP傳往另一端的最大數(shù)據(jù)塊的長(zhǎng)度。值得注意的是,MSS只能出現(xiàn)在SYN報(bào)文段中,若一方不接收來(lái)自另一方的MSS值,則MSS就定為536字節(jié)。一般來(lái)講,MSS值還是越大越好,這樣可以提高網(wǎng)絡(luò)的利用率。
(2)重傳機(jī)制。設(shè)置定時(shí)器,等待確認(rèn)包,如果定時(shí)器超時(shí)還沒(méi)有收到確認(rèn)包,則報(bào)文重傳。
(3)對(duì)首部和數(shù)據(jù)進(jìn)行校驗(yàn)。
(4)接收端對(duì)收到的數(shù)據(jù)進(jìn)行排序,然后交給應(yīng)用層。
(5)接收端丟棄重復(fù)的數(shù)據(jù)。
(6)TCP還提供流量控制,主要是通過(guò)滑動(dòng)窗口來(lái)實(shí)現(xiàn)流量控制。
至此,TCP協(xié)議的數(shù)據(jù)幀格式介紹完了。接下來(lái)開(kāi)始為大家重點(diǎn)介紹:TCP傳輸層的三次握手建立連接,四次揮手釋放連接。
???♂? TCP的三次握手
TCP連接的建立時(shí),雙方需要經(jīng)過(guò)三次握手,而斷開(kāi)連接時(shí),雙方需要經(jīng)過(guò)四次分手,那么,其三次握手和四次分手分別做了什么呢?又是如何進(jìn)行的呢?
通常情況下,建立連接的雙方,由一端打開(kāi)一個(gè)監(jiān)聽(tīng)套接字(ServerSocket)來(lái)監(jiān)聽(tīng)來(lái)自請(qǐng)求方的TCP(Socket)連接,當(dāng)服務(wù)器端監(jiān)聽(tīng)開(kāi)始時(shí),必須做好準(zhǔn)備接受外來(lái)的連接,在Java中該操作通過(guò)創(chuàng)建一個(gè)ServerSocket服務(wù)監(jiān)聽(tīng)套接字實(shí)例來(lái)完成,此操作會(huì)調(diào)用底層操作系統(tǒng)(如Linux)的C代碼中三個(gè)函數(shù)socket()、bind()、listen()來(lái)完成。開(kāi)始監(jiān)聽(tīng)之后,服務(wù)器端就做好接受外來(lái)連接的準(zhǔn)備,如果監(jiān)聽(tīng)到建立新連接的請(qǐng)求,會(huì)開(kāi)啟一個(gè)傳輸套接字,稱(chēng)之為被動(dòng)打開(kāi)(Passive? Open)。
一段簡(jiǎn)單的服務(wù)端監(jiān)聽(tīng)新連接請(qǐng)求,并且被動(dòng)打開(kāi)(Passive Open)傳輸套接字的Java示例代碼,具體如下:
public class SocketServer {
public static void main(String[] args) {
try {
// 創(chuàng)建服務(wù)端socket
ServerSocket serverSocket = new ServerSocket(8080);
//循環(huán)監(jiān)聽(tīng)等待客戶(hù)端的連接
while(true){
//監(jiān)聽(tīng)到客戶(hù)端連接,傳輸套接字被動(dòng)開(kāi)啟
Socket socket = serverSocket.accept();
//開(kāi)啟線程進(jìn)行連接的IO處理
ServerThread thread = new ServerThread(socket);
thread.start();
......
}
} catch (Exception e) {
// 處理異常
e.printStackTrace();
}
}
}
客戶(hù)端在發(fā)起連接建立時(shí),Java代碼通過(guò)創(chuàng)建Socket實(shí)例,調(diào)用底層的connect(…)方法,主動(dòng)打開(kāi)(Active Open)Socket連接。套接字監(jiān)聽(tīng)方在收到請(qǐng)求之后,監(jiān)聽(tīng)方和發(fā)起方(客戶(hù)端)之間就會(huì)建立一條的連接通道,該通道由雙方IP和雙方端口所唯一確定。
一段簡(jiǎn)單的客戶(hù)端連接主動(dòng)打開(kāi)(Active Open)的Java示例代碼,具體如下:
public class SocketClient {
public static void main(String[] args) throws InterruptedException {
try {
// 和服務(wù)器創(chuàng)建連接
Socket socket = new Socket("localhost",8080);
// 寫(xiě)入給監(jiān)聽(tīng)方的輸出流
OutputStream os = socket.getOutputStream();
…..
// 讀取監(jiān)聽(tīng)方的輸入流
InputStream is = socket.getInputStream();
…..
} catch (Exception e) {
e.printStackTrace();
}
}
}
三次握手過(guò)程
TCP連接的建立時(shí),雙方需要經(jīng)過(guò)三次握手,具體過(guò)程如下:
(1)第一次握手:Client進(jìn)入SYN_SENT狀態(tài),發(fā)送一個(gè)SYN幀來(lái)主動(dòng)打開(kāi)傳輸通道,該幀的SYN標(biāo)志位被設(shè)置為1,同時(shí)會(huì)帶上Client分配好的SN序列號(hào),該SN是根據(jù)時(shí)間產(chǎn)生的一個(gè)隨機(jī)值,通常情況下每間隔4ms會(huì)加1。除此之外,SYN幀還會(huì)帶一個(gè)MSS(最大報(bào)文段長(zhǎng)度)可選項(xiàng)的值,表示客戶(hù)端發(fā)送出去的最大數(shù)據(jù)塊的長(zhǎng)度。
(2)第二次握手:Server端在收到SYN幀之后,會(huì)進(jìn)入SYN_RCVD狀態(tài),同時(shí)返回SYN+ACK幀給Client,主要目的在于通知Client,Server端已經(jīng)收到SYN消息,現(xiàn)在需要進(jìn)行確認(rèn)。Server端發(fā)出的SYN+ACK幀的ACK標(biāo)志位被設(shè)置為1,其確認(rèn)序號(hào)AN(Acknowledgment Number)值被設(shè)置為Client的SN+1;SYN+ACK幀的SYN標(biāo)志位被設(shè)置為1,SN值為Server端生成的SN序號(hào);SYN+ACK幀的MSS(最大報(bào)文段長(zhǎng)度)表示的是Server端的最大數(shù)據(jù)塊長(zhǎng)度。
(3)第三次握手:Client在收到Server的第二次握手SYN+ACK確認(rèn)幀之后,首先將自己的狀態(tài)會(huì)從SYN_SENT變成ESTABLISHED,表示自己方向的連接通道已經(jīng)建立成功,Client可以發(fā)送數(shù)據(jù)給Server端了。然后,Client發(fā)ACK幀給Server端,該ACK幀的ACK標(biāo)志位被設(shè)置為1,其確認(rèn)序號(hào)AN(Acknowledgment? Number)值被設(shè)置為Server端的SN序列號(hào)+1。還有一種情況,Client可能會(huì)將ACK幀和第一幀要發(fā)送的數(shù)據(jù),合并到一起發(fā)送給Server端。
(4)Server端在收到Client的ACK幀之后,會(huì)從SYN_RCVD狀態(tài)會(huì)進(jìn)入ESTABLISHED狀態(tài),至此,Server方向的通道連接建立成功,Server可以發(fā)送數(shù)據(jù)給Client,TCP的全雙工連接建立完成。
三次握手的圖解
三次握手的交互過(guò)程,具體如下圖所示:

Client和Server完成了三次握手后,雙方就進(jìn)入了數(shù)據(jù)傳輸?shù)碾A段。數(shù)據(jù)傳輸完成后,連接將斷開(kāi),連接斷開(kāi)的過(guò)程需要經(jīng)歷四次揮手。
???♂? TCP的四次揮手
業(yè)務(wù)數(shù)據(jù)通信完成之后,TCP連接開(kāi)始斷開(kāi)(或者拆接)的過(guò)程,在這個(gè)過(guò)程中連接的每個(gè)端的都能獨(dú)立地、主動(dòng)的發(fā)起,斷開(kāi)的過(guò)程TCP協(xié)議使用了四路揮手操作。
四次揮手具體過(guò)程
四次揮手具體過(guò)程,具體如下:
(1)第一次揮手:主動(dòng)斷開(kāi)方(可以是客戶(hù)端,也可以是服務(wù)器端),向?qū)Ψ桨l(fā)送一個(gè)FIN結(jié)束請(qǐng)求報(bào)文,此報(bào)文的FIN位被設(shè)置為1,并且正確設(shè)置Sequence Number(序列號(hào))和Acknowledgment Number(確認(rèn)號(hào))。發(fā)送完成后,主動(dòng)斷開(kāi)方進(jìn)入FIN_WAIT_1狀態(tài),這表示主動(dòng)斷開(kāi)方?jīng)]有業(yè)務(wù)數(shù)據(jù)要發(fā)送給對(duì)方,準(zhǔn)備關(guān)閉SOCKET連接了。
(2)第二次揮手:正常情況下,在收到了主動(dòng)斷開(kāi)方發(fā)送的FIN斷開(kāi)請(qǐng)求報(bào)文后,被動(dòng)斷開(kāi)方會(huì)發(fā)送一個(gè)ACK響應(yīng)報(bào)文,報(bào)文的Acknowledgment Number(確認(rèn)號(hào))值為斷開(kāi)請(qǐng)求報(bào)文的Sequence Number(序列號(hào))加1,該ACK確認(rèn)報(bào)文的含義是:“我同意你的連接斷開(kāi)請(qǐng)求”。之后,被動(dòng)斷開(kāi)方就進(jìn)入了CLOSE-WAIT(關(guān)閉等待)狀態(tài),TCP協(xié)議服務(wù)會(huì)通知高層的應(yīng)用進(jìn)程,對(duì)方向本地方向的連接已經(jīng)關(guān)閉,對(duì)方已經(jīng)沒(méi)有數(shù)據(jù)要發(fā)送了,若本地還要發(fā)送數(shù)據(jù)給對(duì)方,對(duì)方依然會(huì)接受。被動(dòng)斷開(kāi)方的CLOSE-WAIT(關(guān)閉等待)還要持續(xù)一段時(shí)間,也就是整個(gè)CLOSE-WAIT狀態(tài)持續(xù)的時(shí)間。
主動(dòng)斷開(kāi)方在收到了ACK報(bào)文后,由FIN_WAIT_1轉(zhuǎn)換成FIN_WAIT_2狀態(tài)。
(3)第三次揮手:在發(fā)送完成ACK報(bào)文后,被動(dòng)斷開(kāi)方還可以繼續(xù)完成業(yè)務(wù)數(shù)據(jù)的發(fā)送,待剩余數(shù)據(jù)發(fā)送完成后,或者CLOSE-WAIT(關(guān)閉等待)截止后,被動(dòng)斷開(kāi)方會(huì)向主動(dòng)斷開(kāi)方發(fā)送一個(gè)FIN+ACK結(jié)束響應(yīng)報(bào)文,表示被動(dòng)斷開(kāi)方的數(shù)據(jù)都發(fā)送完了,然后,被動(dòng)斷開(kāi)方進(jìn)入LAST_ACK狀態(tài)。
(4)第四次揮手:主動(dòng)斷開(kāi)方收在到FIN+ACK斷開(kāi)響應(yīng)報(bào)文后,還需要進(jìn)行最后的確認(rèn),向被動(dòng)斷開(kāi)方發(fā)送一個(gè)ACK確認(rèn)報(bào)文,然后,自己就進(jìn)入TIME_WAIT狀態(tài),等待超時(shí)后最終關(guān)閉連接。處于TIME_WAIT狀態(tài)的主動(dòng)斷開(kāi)方,在等待完成2MSL的時(shí)間后,如果期間沒(méi)有收到其他報(bào)文,則證明對(duì)方已正常關(guān)閉,主動(dòng)斷開(kāi)方的連接最終關(guān)閉。
被動(dòng)斷開(kāi)方在收到主動(dòng)斷開(kāi)方的最后的ACK報(bào)文以后,最終關(guān)閉了連接,自己啥也不管了。
四次揮手圖解
四次揮手的全部交互過(guò)程,具體如下圖所示:

處于TIME_WAIT狀態(tài)的主動(dòng)斷開(kāi)方,在等待完成2MSL的時(shí)間后,才真正關(guān)閉連接通道,其等待的時(shí)間為什么是2MSL呢?
2MSL翻譯過(guò)來(lái)就是兩倍的MSL。MSL全稱(chēng)為Maximum Segment Lifetime,指的是一個(gè)TCP報(bào)文片段在網(wǎng)絡(luò)中最大的存活時(shí)間,具體來(lái)說(shuō),2MSL對(duì)應(yīng)于一次消息的來(lái)回(一個(gè)發(fā)送和一個(gè)回復(fù))所需的最大時(shí)間。如果直到2MSL,主動(dòng)斷開(kāi)方都沒(méi)有再一次收到對(duì)方的報(bào)文(如FIN報(bào)文),則可以推斷ACK已經(jīng)被對(duì)方成功接收,此時(shí),主動(dòng)斷開(kāi)方將最終結(jié)束自己的TCP連接。所以,TCP的TIME_WAIT狀態(tài)也稱(chēng)為2MSL等待狀態(tài)。
有關(guān)MSL的具體的時(shí)間長(zhǎng)度,在RFC1122協(xié)議中推薦為2分鐘。在SICS(瑞典計(jì)算機(jī)科學(xué)院)開(kāi)發(fā)的一個(gè)小型開(kāi)源的TCP/IP協(xié)議?!狶wIP開(kāi)源協(xié)議棧中MSL默認(rèn)為1分鐘。在源自Berkeley的TCP協(xié)議棧實(shí)現(xiàn)中MSL默認(rèn)長(zhǎng)度為30秒??傮w來(lái)說(shuō),TIME_WAIT(2MSL)等待狀態(tài)的時(shí)間長(zhǎng)度,一般維持在1-4分鐘之間。
通過(guò)三次握手建立連接和四次揮手拆除連接,一次TCP的連接建立及拆除,至少進(jìn)行7次通信,可見(jiàn)其成本是很高的。
???♂? 三次握手、四次揮手的常見(jiàn)面試題
有關(guān)TCP的連接建立的三次握手及拆除過(guò)程的四次揮手的面試問(wèn)題,是技術(shù)面試過(guò)程中的出現(xiàn)頻率很高的重點(diǎn)和難點(diǎn)問(wèn)題,常見(jiàn)問(wèn)題大致如下:
問(wèn)題(1):為什么關(guān)閉連接的需要四次揮手,而建立連接卻只要三次握手呢?
關(guān)閉連接時(shí),被動(dòng)斷開(kāi)方在收到對(duì)方的FIN結(jié)束請(qǐng)求報(bào)文時(shí),很可能業(yè)務(wù)數(shù)據(jù)沒(méi)有發(fā)送完成,并不能立即關(guān)閉連接,被動(dòng)方只能先回復(fù)一個(gè)ACK響應(yīng)報(bào)文,告訴主動(dòng)斷開(kāi)方:“你發(fā)的FIN報(bào)文我收到了,只有等到我所有的業(yè)務(wù)報(bào)文都發(fā)送完了,我才能真正的結(jié)束,在結(jié)束之前,我會(huì)發(fā)你FIN+ACK報(bào)文的,你先等著”。所以,被動(dòng)斷開(kāi)方的確認(rèn)報(bào)文,需要拆開(kāi)成為兩步,故總體就需要四步揮手。
而在建立連接場(chǎng)景中,Server端的應(yīng)答可以稍微簡(jiǎn)單一些。當(dāng)Server端收到Client端的SYN連接請(qǐng)求報(bào)文后,其中ACK報(bào)文表示對(duì)請(qǐng)求報(bào)文的應(yīng)答,SYN報(bào)文用來(lái)表示服務(wù)端的連接也已經(jīng)同步開(kāi)啟了,而ACK報(bào)文和SYN報(bào)文之間,不會(huì)有其他報(bào)文需要發(fā)送,故而可以合二為一,可以直接發(fā)送一個(gè)SYN+ACK報(bào)文。所以,在建立連接時(shí),只需要三次握手即可。
問(wèn)題(2):為什么連接建立的時(shí)候是三次握手,可以改成兩次握手嗎?
三次握手完成兩個(gè)重要的功能:一是雙方都做好發(fā)送數(shù)據(jù)的準(zhǔn)備工作,而且雙方都知道對(duì)方已準(zhǔn)備好;二是雙方完成初始SN序列號(hào)的協(xié)商,雙方的SN序列號(hào)在握手過(guò)程中被發(fā)送和確認(rèn)。
如果把三次握手改成兩次握手,可能發(fā)生死鎖。兩次握手的話,缺失了Client的二次確認(rèn)ACK幀,假想的TCP建立的連接時(shí)二次揮手,可以如下圖所示:

在假想的TCP建立的連接時(shí)二次握手過(guò)程中,Client發(fā)送Server發(fā)送一個(gè)SYN請(qǐng)求幀,Server收到后發(fā)送了確認(rèn)應(yīng)答SYN+ACK幀。按照兩次握手的協(xié)定,Server認(rèn)為連接已經(jīng)成功地建立了,可以開(kāi)始發(fā)送數(shù)據(jù)幀。這個(gè)過(guò)程中,如果確認(rèn)應(yīng)答SYN+ACK幀在傳輸中被丟失,Client沒(méi)有收到,Client將不知道Server是否已準(zhǔn)備好,也不知道Server的SN序列號(hào),Client認(rèn)為連接還未建立成功,將忽略Server發(fā)來(lái)的任何數(shù)據(jù)分組,會(huì)一直等待Server的SYN+ACK確認(rèn)應(yīng)答幀。而Server在發(fā)出的數(shù)據(jù)幀后,一直沒(méi)有收到對(duì)應(yīng)的ACK確認(rèn)后就會(huì)產(chǎn)生超時(shí),重復(fù)發(fā)送同樣的數(shù)據(jù)幀。這樣就形成了死鎖。
問(wèn)題(3):為什么主動(dòng)斷開(kāi)方在TIME-WAIT狀態(tài)必須等待2MSL的時(shí)間?
原因之一:主動(dòng)斷開(kāi)方等待2MSL的時(shí)間,是為了確保兩端都能最終關(guān)閉。假設(shè)網(wǎng)絡(luò)是不可靠的,被動(dòng)斷開(kāi)方發(fā)送FIN+ACK報(bào)文后,其主動(dòng)方的ACK響應(yīng)報(bào)文有可能丟失,這時(shí)候的被動(dòng)斷開(kāi)方處于LAST-ACK狀態(tài)的,由于收不到ACK確認(rèn)被動(dòng)方一直不能正常的進(jìn)入CLOSED狀態(tài)。在這種場(chǎng)景下,被動(dòng)斷開(kāi)方會(huì)超時(shí)重傳FIN+ACK斷開(kāi)響應(yīng)報(bào)文,如果主動(dòng)斷開(kāi)方在2MSL時(shí)間內(nèi),收到這個(gè)重傳的FIN+ACK報(bào)文,會(huì)重傳一次ACK報(bào)文,后再一次重新啟動(dòng)2MSL計(jì)時(shí)等待,這樣,就能確保被動(dòng)斷開(kāi)方能收到ACK報(bào)文,從而能確保被動(dòng)方順利進(jìn)入到CLOSED狀態(tài)。只有這樣,雙方都能夠確保關(guān)閉。反過(guò)來(lái)說(shuō),如果主動(dòng)斷開(kāi)方在發(fā)送完ACK響應(yīng)報(bào)文后,不是進(jìn)入TIME_WAIT狀態(tài)去等待2MSL時(shí)間,而是立即釋放連接,則將無(wú)法收到被動(dòng)方重傳的FIN+ACK報(bào)文,所以不會(huì)再發(fā)送一次ACK確認(rèn)報(bào)文,此時(shí)處于LAST-ACK狀態(tài)的被動(dòng)斷開(kāi)方,無(wú)法正常進(jìn)入到CLOSED狀態(tài)。
原因之二:防止“舊連接的已失效的數(shù)據(jù)報(bào)文”出現(xiàn)在新連接中。主動(dòng)斷開(kāi)方在發(fā)送完最后一個(gè)ACK報(bào)文后,再經(jīng)過(guò)2MSL,才能最終關(guān)閉和釋放端口,這就意味著,相同端口的新TCP新連接,需要在2MSL的時(shí)間之后,才能夠正常的建立。2MSL這段時(shí)間內(nèi),舊連接所產(chǎn)生的所有數(shù)據(jù)報(bào)文,都已經(jīng)從網(wǎng)絡(luò)中消失了,從而,確保了下一個(gè)新的連接中不會(huì)出現(xiàn)這種舊連接請(qǐng)求報(bào)文。
問(wèn)題(4):如果已經(jīng)建立了連接,但是Client端突然出現(xiàn)故障了怎么辦?
TCP還設(shè)有一個(gè)?;钣?jì)時(shí)器,Client端如果出現(xiàn)故障,Server端不能一直等下去,這樣會(huì)浪費(fèi)系統(tǒng)資源。每收到一次Client客戶(hù)端的數(shù)據(jù)幀后,Server端都的保活計(jì)時(shí)器會(huì)復(fù)位。計(jì)時(shí)器的超時(shí)時(shí)間通常是設(shè)置為2小時(shí),若2小時(shí)還沒(méi)有收到Client端的任何數(shù)據(jù)幀,Server端就會(huì)發(fā)送一個(gè)探測(cè)報(bào)文段,以后每隔75秒鐘發(fā)送一次。若一連發(fā)送10個(gè)探測(cè)報(bào)文仍然沒(méi)反應(yīng),Server端就認(rèn)為Client端出了故障,接著就關(guān)閉連接。如果覺(jué)得?;钣?jì)時(shí)器的兩個(gè)多小時(shí)的間隔太長(zhǎng),可以自行調(diào)整TCP連接的保活參數(shù)。
?? 參考資料
TCP的三次握手與四次揮手
圖解TCP/IP |?TCP/IP協(xié)議詳解
清晰認(rèn)識(shí)TCP/IP 協(xié)議,圖解秒懂?| 圖解TCP/IP詳解(史上最全)?
TCP/IP協(xié)議-網(wǎng)絡(luò)七層協(xié)議?|?七層網(wǎng)絡(luò)協(xié)議詳細(xì)解釋?文章來(lái)源:http://www.zghlxwxcb.cn/news/detail-455639.html
文章來(lái)源地址http://www.zghlxwxcb.cn/news/detail-455639.html
到了這里,關(guān)于一文講透TCP/IP協(xié)議 | 圖解+秒懂+史上最全的文章就介紹完了。如果您還想了解更多內(nèi)容,請(qǐng)?jiān)谟疑辖撬阉鱐OY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!