協議森林02 小喇叭開始廣播 (以太網與WiFi協議)
作者:Vamei 出處:http://www.cnblogs.com/vamei 歡迎轉載,也請保留這段聲明。謝謝!
“小喇叭開始廣播啦”,如果你知道這個,你一定是老一輩的人。“小喇叭”是五十年代到八十年代的兒童廣播節目。在節目一開始,都會有一段這樣的播音:“小朋友,小喇叭開始廣播了!” 聽到這裏,收音機前的小朋友就興奮起來,準備好聽節目了:這一期的內容是以太網(Ethernet)協議與WiFi。
我們在郵差與郵局中說到,以太網和WiFi是連接層的兩種協議。在連接層,信息以幀(frame)爲單位傳輸。幀像信封一樣將數據(payload)包裹起來,並註明收信地址和送信地址。連接層實現了“本地社區”的通信。我們先來看看以太網的幀。
以太網的幀格式
幀本身是一段有限的0/1序列。它可以分爲頭部、數據(Payload)和尾部三部分:
Preamble | SFD | DST | SRC | Type | Payload (Data) | Pad | FCS | Extension |
幀按照上面的順序從頭到尾依次被髮送/接收。我們下面進一步解釋各個區域。
頭部
幀的最初7個byte被稱爲序言(preamble)。它的每個byte都是0xAA(這裏是十六進制,也就是二進制的10101010)。通常,我們都會預定好以一定的頻率發送0/1序列(比如每秒10bit)。如果接收設備以其他頻率接收(比如每秒5bit),那麼就會錯漏掉應該接收的0/1信息。但是,由於網卡的不同,發送方和接收方即使預訂的頻率相同,兩者也可能由於物理原因發生偏差。這就好像兩個人約好的10點見,結果一個人錶快,一個人錶慢一樣。序言是爲了讓接收設備調整接收頻率,以便與發送設備的頻率一致,這個過程就叫做時鐘復原(recover the clock)。
(就像在收聽廣播之前,調整轉鈕,直到聲音清晰。網卡會在接收序言的過程中不斷微調自己的接收頻率,直到自己“聽到”是...1010...)
時鐘調整好之後,我們等待幀的起始信號(SFD, start frame delimiter)。SFD是固定的值0xAB。這個0xAB就好像“小喇叭開始廣播啦”一樣,提醒我們好節目就要上演了。
Preamble和SFD
緊隨SFD之後的是6 byte的目的地(DST, destination)和6 byte的發出地(SRC, source)。這就是我們在郵差和郵局中的介紹一樣,爲信封寫上目的地和發出地。要注意,這裏寫在信封上的是對地址的“本地描述”,也就是MAC地址。MAC地址是物理設備自帶的序號,只能在同一個以太網中被識別 (正如郵差只熟悉自己的社區一樣)。
頭部的最後一個區域是Type,用以說明數據部分的類型。(比如0x0800爲IPv4,0x0806爲ARP)
數據
數據一般包含有符合更高層協議的數據,比如IP包。連接層協議本身並不在乎數據是什麼,它只負責傳輸。注意,數據尾部可能填充有一串0(PAD區域)。原因是數據需要超過一定的最小長度。
尾部
跟隨在數據之後的是校驗序列(FCS, Frame Check Sequence)。校驗序列是爲了檢驗數據的傳輸是否發生錯誤。在物理層,我們通過一些物理信號來表示0/1序列(比如高壓/低壓,高頻率/低頻率等),但這些物理信號可能在傳輸過程中受到影響,以致於發生錯誤。如何來發現我們的數據是正確的呢?
一個方法是將數據發送兩遍,然後對比一下是否一樣。但這樣就大大降低了網絡的效率。FCS採用了CRC(Cyclic Redundancy Check)算法。這就好像是一家飯店的老闆僱傭了一個收銀員,但他又擔心收銀員黑錢。可是每天營業額很大,老闆即使坐在旁邊看,也不能用記住收到的總數。所以他採取了一個聰明的辦法:只記住收到錢的最後一位 (比如收到19元,老闆記住9)。當有新的進賬(比如13,尾數爲3),他就將新的尾數和舊的尾數相加,再記住和的尾數(也就是2)。當收銀員交給老闆錢的時候,老闆只用看總額的最後一位是否和自己記的最後一位相同,就可以知道收銀員是否誠實了。如果說我們的數據是收銀的總額的話,我們的FCS就是老闆記錄的尾數。如果兩者不相符,我們就知道數據在傳輸的過程中出現錯誤,不能使用。
有FCS在盯着
上面的比喻實際上是用營業總額不斷的除以10,獲得最終的尾數。CRC算法也相類似。n位CRC算法取一個n bit的因子,比如下面的1011。數據序列結尾增加n-1個0。因子與數據序列的不斷進行XOR運算,直到得到n-1位的餘數,也就是100。該餘數各位取反(011),然後存儲在FCS的位置。
11010011101100 000 <--- 數據序列末尾增加3位01011 <--- 因子01100011101100 000 <--- XOR結果 1011 <--- 因子00111011101100 000 101100010111101100 000 101100000001101100 000 101100000000110100 000 101100000000011000 000 101100000000001110 000 101100000000000101 000 101 1-----------------00000000000000 100 <--- 3位餘數
上面例子用的是4位CRC。在Ethernet中使用的因子爲32位的,以達到更好的檢測效果。
集線器(Hub) vs. 交換器(Switch)
以太網使用集線器或者交換器將幀從發出地傳送到目的地。一臺集線器或交換器上有多個端口,每個端口都可以連接一臺計算機(或其他設備)。
集線器像一個廣播電臺。一臺電腦將幀發送到集線器,集線器會將幀轉發到所有其他的端口。每臺計算機檢查自己的MAC地址是不是符合DST。如果不是,則保持沉默。集線器是比較早期的以太網設備。它有明顯的缺陷:
1) 任意兩臺電腦的通信在同一個以太網上是公開的。所有連接在同一個集線器上的設備都能收聽到別人在傳輸什麼,這樣很不安全。可以通過對信息加密提高安全性。
2) 不允許多路同時通信。如果兩臺電腦同時向集線器發信,集線器會向所有設備發出“衝突”信息,提醒發生衝突。可以在設備上增加衝突檢測算法(collision detection):一旦設備發現有衝突,則隨機等待一段時間再重新發送。
交換器克服集線器的缺陷。交換器記錄有各個設備的MAC地址。當幀發送到交換器時,交換器會檢查DST,然後將幀只發送到對應端口。交換器允許多路同時通信。由於交換器的優越性,交換器基本上取代了集線器。但比較老的以太網還有可能在使用集線器。
下面的一個視頻來自CISCO,更加形象的解釋了這兩種設備
http://v.youku.com/v_show/id_XNDgwNTQ5OTI4.html
WiFi
WiFi的工作方式與集線器連接下的以太網類似。一個WiFi設備會向所有的WiFi設備發送幀,其它的WiFi設備檢查自己是否符合DST。由於WiFi採取無線電信號,所以很難像交換器一樣定向發送,所以WiFi的安全性很值得關注。WiFi採用加密的方法來實現信息的安全性。
(早期的WEP加密方法非常脆弱,建議使用WPA或者WPA2加密方法。隱藏WiFi設備ID的方法不是很有用。)
總結
我們深入了連接層協議的一些細節。連接層是物理與邏輯的接口,它的設計兼顧了物理需求(比如時鐘復原,CRC)和邏輯需求(比如地址、數據)。由於連接層處於網絡邏輯的底層,有許多基於連接層的***手法,這需要我們對連接層的工作方式有一定的瞭解,以設計出更好的網絡安全策略。
歡迎繼續閱讀“協議森林”系列