使用 SCTP 優化網絡

流控制傳輸協議結合了 TCP 和 UDP 的優點

文檔選項

<script type="text/javascript" language="JavaScript"> </script>
		將此頁作爲電子郵件發送
		樣例代碼

級別：初級

M. Tim Jones ([email protected]), 資深首席軟件工程師, Emulex

2006 年 4 月 10 日

流控制傳輸協議（Stream Control Transmission Protocol，SCTP）是一種可靠的傳輸協議，它在兩個端點之間提供穩定、有序的數據傳遞服務（非常類似於 TCP），並且可以保護數據消息邊界（例如 UDP）。然而，與 TCP 和 UDP 不同，SCTP 是通過多宿主（Multi-homing）和多流（Multi-streaming）功能提供這些收益的，這兩種功能均可提高可用性。在本文中，我們將學習 Linux® 2.6 內核中 SCTP 的關鍵特性，並通過服務器和客戶機的源代碼瞭解該協議提供多流的能力。

SCTP 是在 IP 網絡上使用的一種可靠的通用傳輸層協議。儘管 SCTP 協議最初是爲發送電話信號而設計的（RFC 2960），但帶來了一個意外的收穫：它通過借鑑 UDP 的優點解決了 TCP 的某些侷限。SCTP 提供的特性使套接字初始化的可用性、可靠性和安全性都得以提高。（圖 1 給出了 IP 堆棧的層次化架構。）

圖 1. IP 棧的層次化架構

本文簡要介紹了 Linux 2.6 內核中 SCTP 的概念，重點介紹了一些高級特性（例如多宿主和多流），並且給出了服務器和客戶機的部分代碼片斷（並給出了一個可以獲得更多代碼的 URL），從而展示了這種協議提供多流的能力。

下面讓我們開始介紹 IP 堆棧的內容。

IP 堆棧

Internet 協議套件被劃分成幾層；每層都提供特定功能，如圖 1 所示。

自下而上：

鏈路層（link layer） 提供了通信介質的物理接口（例如以太網設備）。
網絡層（network layer） 負責管理網絡中的報文移動，具體來說就是確保報文都到達自己的目標（也稱爲路由）。
傳輸層（transport layer） 爲應用層控制了報文在兩臺主機之間的流動。它還代表通信的應用程序端點，稱爲 端口（port）。
最後，應用層（application layer） 對通過套接字傳遞數據具有深刻的意義。這些數據可能包括通過簡單郵件傳輸協議（Simple Mail Transport Protocol，SMTP）發送的 e-mail 消息，或通過超文本傳輸協議（Hypertext Transport Protocol，HTTP）呈現的 Web 頁面。

所有應用層協議都使用套接字層作爲與傳輸層協議之間的接口。Sockets API 是由 UC Berkeley 在 BSD UNIX® 操作系統上開發的。

在深入鑽研 SCTP 之前，讓我們首先簡單回顧一下傳統的傳輸層協議。

傳輸層協議

兩種最流行的傳輸層協議是傳輸控制協議（TCP）和用戶數據報協議（UDP）：

TCP 是一種可靠的協議，它可以確保有序地發送數據，並管理網絡中的擁塞問題。
UDP 是一種面向消息的協議，它不能確保有序地發送數據，也無法管理網絡擁塞的問題。

然而，UDP 是一種快速協議，可以保護自己傳輸的消息的邊界。

本文引出了另外一個選擇：SCTP。它提供了像 TCP 一樣可靠、有序地發送數據的功能，但卻以像 UDP 一樣面向消息的方式來進行操作，這可以保護消息邊界。SCTP 還提供了幾個高級特性：

多宿主（Multi-homing）
多流（Multi-streaming）
初始化保護（Initiation protection）
消息分幀（Message framing）
可配置的無序發送（Configurable unordered delivery）
平滑關閉（Graceful shutdown）

SCTP 的關鍵特性

SCTP 相對於傳統的傳輸層協議來說，兩個重要的增強是終端主機的多宿主和多流功能。

多宿主

多宿主 爲應用程序提供了比 TCP 更高的可用性。多宿主主機就是一臺具有多個網絡接口的主機，因此可以通過多個 IP 地址來訪問這臺主機。在 TCP 中，連接（connection） 是指兩個端點之間的一個通道（在這種情況下，就是兩臺主機的網絡接口之間的一個套接字）。SCTP 引入了 聯合（association） 的概念，它也是存在於兩臺主機之間，但可以使用每臺主機上的多個接口進行協作。

圖 2 闡述了 TCP 連接與 SCTP 聯合之間的區別。

圖 2. TCP 連接與 SCTP 聯合

該圖的上面部分是 TCP 連接，每個主機都只包含一個網絡接口；連接是在每個客戶機和服務器之間的單個接口之間建立的。在建立連接時，就被綁定到了每個接口上。

在該圖的下面部分中，您可以看到這樣一個架構：每臺主機上都包含兩個網絡接口。通過獨立網絡提供了兩條路徑，一條是從接口 C0 到 S0，另外一條是從接口 C1 到 S1。在 SCTP 中，這兩條路徑可以合併到一個聯合中。

SCTP 負責使用內嵌的 heartbeat 機制來監視聯合的路徑；在檢測到一條路徑失效時，協議就會通過另外一條路徑來發送通信數據。應用程序甚至都不必知道發生了故障恢復。

故障轉移也可以用於維護網絡應用程序的連通性。例如，讓我們來考慮一臺包含一個無線 802.11 接口和一個以太網接口的筆記本的例子。當筆記本放到固定的位置上時，我們傾向於使用高速的以太網接口（在 SCTP 中稱爲 主地址（primary address））；但是在這個連接丟失時（例如離開了固定位置），連接可遷移到無線接口上。在返回固定位置時，以太網連接會被重新檢測到，通信就可以在這個接口上恢復。這是一種能提供更高的可用性和可靠性的強大機制。

多流

從某種意義上來講，SCTP 連接與 TCP 連接類似，不同之處只是 SCTP 能夠在一個聯合中支持多流機制。一個聯合中的所有流都是獨立的，但均與該聯合相關（請參見圖 3）。

圖 3. SCTP 聯合與流之間的關係

每個流都給定了一個流編號，它被編碼到 SCTP 報文中，通過聯合在網絡上傳送。多流非常重要，因爲阻塞的流（例如等待重傳的流會導致報文的丟失）不會影響同一聯合中的其他流。這個問題統稱爲 head-of-line blocking（對頭阻塞）。TCP 很容易出現這類阻塞問題。

多流如何在傳輸數據時提供更好的響應性呢？例如，HTTP 協議會在相同套接字上共享控制和數據。Web 客戶機從服務器上請求一個文件，服務器通過相同的連接將這個文件發回給客戶機。多流的 HTTP 服務器可以提供更好的交互能力，因爲在聯合中各單獨的流上可以處理多個請求。這種功能可以並行化響應，儘管速度不一定會更快，但可以同時加載 HTML 和圖像映像，從而表現出更好的響應性。

多流處理是 SCTP 的一個重要特性，尤其是在協議的設計中考慮一些控制和數據的問題時更是如此。在 TCP 中，控制和數據通常都是通過相同的連接進行共享的，這可能會產生問題，因爲控制報文可能會在數據報之後延時。如果控制和數據被劃分成單獨的流，控制數據就可以以一種更及時的方式進行處理，從而可以更好地利用可用資源。

初始化保護

TCP 和 SCTP 中對新連接的初始化是通過報文握手來完成的。在 TCP 中，這種機制稱爲 三次握手（three-way handshake）。客戶機向服務器首先發送一個 SYN 報文（Synchronize 的簡寫），服務器使用一個 SYN-ACK 報文進行響應（Synchronize-Acknowledge）。最後，客戶機使用一個 ACK 報文確認已接收到報文（請參見圖 4）。

圖 4. TCP 和 STCP 握手使用的報文交換

當惡意客戶機使用虛假的源地址來僞造一個 IP 報文時，TCP 就會出現問題了，這會大量 TCP SYN 報文攻擊服務器。服務器在接收 SYN 報文之前，要爲連接分配資源，但是在大量產生 SYN 報文的情況下，最終會耗盡自己的資源，從而無法處理新的請求。這種情況就稱爲 服務拒絕（Denial of Service）（DoS）攻擊。

SCTP 可以通過一種 4 次握手的機制並引入了 cookie 的概念來有效地防止這種攻擊的產生。在 SCTP 中，客戶機使用一個 INIT 報文發起一個連接。服務器使用一個 INIT-ACK 報文進行響應，其中就包括了 cookie（標識這個連接的惟一上下文）。客戶機然後就使用一個 COOKIE-ECHO 報文進行響應，其中包含了服務器所發送的 cookie。現在，服務器要爲這個連接分配資源，並通過向客戶機發送一個 COOKIE-ACK 報文對其進行響應。

要解決使用這種 4 次握手機制解決延時數據移動的問題，SCTP 允許把數據包含到 COOKIE-ECHO 和 COOKIE-ACK 報文中。

消息分幀

使用消息分幀機制，就可以保護消息只在一個邊界內通過 socket 進行通信；這意味着如果客戶機向服務器先發送 100 個字節，然後又發送 50 個字節。那麼服務器就會在兩次讀取操作中分別讀取到 100 個字節和 50 個字節。UDP 也是這樣進行操作，這對於面向消息的協議非常有益。

與此不同，TCP 是按照字節流的方式進行操作。如果沒有分幀機制，一端接收到的數據可能比另外一端發送的數據多或少（這會將一次寫操作劃分成多次操作，或者將多次寫操作合併到一個讀操作中）。這種行爲需要在 TCP 之上進行操作的面向消息的協議可以在應用層中提供數據緩衝和消息分幀機制（這可能是一項複雜的任務）。

SCTP 在數據傳輸中提供了消息分幀功能。當一端對一個套接字執行寫操作時，可確保對等端讀出的數據大小與此相同（請參見圖 5）。

圖 5. UDP/SCTP 中的消息分幀與面向字節流協議的比較

對於面向流的數據來說，例如音頻和視頻數據，可以沒有分幀機制。

可配置的無序發送

SCTP 中的消息的傳輸十分可靠，但未必是按照想要的次序來傳輸的。TCP 可以確保數據是按照次序發送的（考慮到 TCP 是一種流協議，這是一件好事）。UDP 無法確保有序地發送數據。但是如果需要，您也可以在 SCTP 中配置流來接受無序的消息。

這種特性在面向消息的協議中可能非常有用，因爲其中的消息都是獨立的，次序並不重要。另外，您可以在一個聯合中按照逐個流配置無序發送。

平滑關閉

TCP 和 SCTP 都是基於連接的協議，而 UDP 則是一種無連接的協議。TCP 和 SCTP 都需要在對等的兩端建立和拆除連接。SCTP 與 TCP 中關閉連接的不同之處在於 TCP 中連接的刪除是半關閉（half-close） 的。

圖 6 給出了 TCP 和 SCTP 的關閉序列。

圖 6. TCP 和 SCTP 的連接結束序列

在 TCP 中，一端可以關閉自己這端的 socket（這樣會導致發送一個 FIN 報文），但是仍然可以繼續接收數據。FIN 說明這個端點不會再發送數據，但是在這一端關閉自己這端的套接字之前，它一直可以繼續傳輸數據。應用程序很少使用這種半關閉狀態，因此 SCTP 的設計者就選擇放棄這種狀態，並將其替換成了一個顯式的終結序列。當一端關閉自己的套接字時（導致產生一個 SHUTDOWN 原語），對等的兩端全部需要關閉，將來任何一端都不允許再進行數據的移動了。

多流的展示

現在您已經瞭解了 SCTP 的基本特性了，接下來讓我們來看一下使用 C 編程語言編寫的一個樣例服務器和客戶機，並展示 SCTP 的多流特性。

這個例子開發了一個服務器，它實現了一種形式的日期查詢協議。這個傳統的服務器會在連接上來的客戶機上打印當前時間，但是對於 SCTP 來說，我們會在流 0 上打印本地時間，在流 1 上打印格林威治時間（GMT）。這個例子讓我們可以展示如何使用這些 API 來開發流通信。

圖 7 對整個過程進行了歸納，它不但從套接字 API 的角度展示了應用程序的流程，而且還從客戶機和服務器的角度介紹了它們之間的關係。

圖 7. 在多流日期查詢服務器和客戶機中使用的套接字函數

這些應用程序是在 GNU/Linux 操作系統上開發的，其內核版本是 2.6.11，並且包含了 Linux Kernel SCTP 項目（lksctp）。其中非標準的 socket 函數是在 lksctp 工具包中提供的，這個工具包可以從 SourceForge 上獲得。請參看參考資料中的鏈接。

daytime 服務器

清單 1 給出了這個多流 daytime 服務器的代碼。爲了可讀性更好，我們在清單 1 中忽略了所有的錯誤檢查，但是這些展示錯誤檢查機制的代碼與其他 SCTP 套接字擴展一樣都可以通過給出的鏈接下載到。

清單 1. 使用多流機制爲 SCTP 編寫的日期查詢服務器

int main()
{
  int listenSock, connSock, ret;
  struct sockaddr_in servaddr;
  char buffer[MAX_BUFFER+1];
  time_t currentTime;
  /* Create SCTP TCP-Style Socket */
  listenSock = socket( AF_INET, SOCK_STREAM, IPPROTO_SCTP );
  /* Accept connections from any interface */
  bzero( (void *)&servaddr, sizeof(servaddr) );
  servaddr.sin_family = AF_INET;
  servaddr.sin_addr.s_addr = htonl( INADDR_ANY );
  servaddr.sin_port = htons(MY_PORT_NUM);
  /* Bind to the wildcard address (all) and MY_PORT_NUM */
  ret = bind( listenSock,
               (struct sockaddr *)&servaddr, sizeof(servaddr) );
  /* Place the server socket into the listening state */
listen( listenSock, 5 );
  /* Server loop... */
  while( 1 ) {
    /* Await a new client connection */
    connSock = accept( listenSock,
                        (struct sockaddr *)NULL, (int *)NULL );
    /* New client socket has connected */
    /* Grab the current time */
    currentTime = time(NULL);
    /* Send local time on stream 0 (local time stream) */
    snprintf( buffer, MAX_BUFFER, "%s/n", ctime(&currentTime) );
    ret = sctp_sendmsg( connSock,
                          (void *)buffer, (size_t)strlen(buffer),
                          NULL, 0, 0, 0, LOCALTIME_STREAM, 0, 0 );
    /* Send GMT on stream 1 (GMT stream) */
    snprintf( buffer, MAX_BUFFER, "%s/n",
               asctime( gmtime( &currentTime ) ) );
    ret = sctp_sendmsg( connSock,
                          (void *)buffer, (size_t)strlen(buffer),
                          NULL, 0, 0, 0, GMT_STREAM, 0, 0 );
    /* Close the client connection */
close( connSock );
  }
  return 0;
}

清單 1 中的服務器首先創建服務器的套接字（使用 IPPROTO_SCTP 來創建一個 SCTP 的一對一的套接字）。然後創建一個 sockaddr 結構，指定這個連接可以從任何本地接口上創建（使用通配符地址 INADDR_ANY）。我們使用 bind 調用將這個 sockaddr 結構綁定到 socket 上，然後將服務器套接字設置成監聽狀態。現在就可以接收到達的連接了。

注意 SCTP 使用了很多與 TCP 和 UDP 相同的套接字 API。在 lksctp 開發工具中還提供了其他一些 API 函數（請參看參考資料）。

在服務器的循環中，一直等待新客戶機的連接請求。在從 accept 函數返回時，會使用 connSock socket 標識新客戶機的連接。我們使用 time 函數來獲取當前時間，然後使用 snprintf 將其轉換成字符串。使用 sctp_sendmsg 函數（一個非標準的 socket 調用），可以通過指定特定的流程（LOCALTIME_STREAM，將這個字符串發送給客戶機。當發送本地時間字符串之後，我們將使用 GMT 表示的當前時間轉換成一個字符串，然後將其發送到流 GMT_STREAM 上。

現在，日期查詢服務器已經完成了自己的職責，因此我們就可以關閉這個 socket，然後等待一個新的客戶機連接。一切都非常簡單，對嗎？現在讓我們來看一下日期查詢客戶機是如何處理多流的。

日期查詢客戶機

多流客戶機如清單 2 所示。

清單 2. 使用多流機制爲 SCTP 編寫的日期查詢客戶機

int main()
{
  int connSock, in, i, flags;
  struct sockaddr_in servaddr;
  struct sctp_sndrcvinfo sndrcvinfo;
  struct sctp_event_subscribe events;
  char buffer[MAX_BUFFER+1];
  /* Create an SCTP TCP-Style Socket */
  connSock = socket( AF_INET, SOCK_STREAM, IPPROTO_SCTP );
  /* Specify the peer endpoint to which we'll connect */
  bzero( (void *)&servaddr, sizeof(servaddr) );
  servaddr.sin_family = AF_INET;
  servaddr.sin_port = htons(MY_PORT_NUM);
  servaddr.sin_addr.s_addr = inet_addr( "127.0.0.1" );
  /* Connect to the server */
connect( connSock, (struct sockaddr *)&servaddr, sizeof(servaddr) );
  /* Enable receipt of SCTP Snd/Rcv Data via sctp_recvmsg */
  memset( (void *)&events, 0, sizeof(events) );
  events.sctp_data_io_event = 1;
setsockopt( connSock, SOL_SCTP, SCTP_EVENTS,
               (const void *)&events, sizeof(events) );
  /* Expect two messages from the peer */
  for (i = 0 ; i < 2 ; i++) {
    in = sctp_recvmsg( connSock, (void *)buffer, sizeof(buffer),
                        (struct sockaddr *)NULL, 0,
                        &sndrcvinfo, &flags );
    /* Null terminate the incoming string */
    buffer[in] = 0;
    if        (sndrcvinfo.sinfo_stream == LOCALTIME_STREAM) {
      printf("(Local) %s/n", buffer);
    } else if (sndrcvinfo.sinfo_stream == GMT_STREAM) {
      printf("(GMT  ) %s/n", buffer);
    }
  }
  /* Close our socket and exit */
close(connSock);
  return 0;
}

在客戶機中，我們首先創建了一個 SCTP 套接字，然後創建了一個 sockaddr 結構，其中包含了將要連接的端點。connect 函數然後建立一個到服務器的連接。要獲取消息的流編號，SCTP 需要啓用套接字選項 sctp_data_io_event。

通過啓用這個選項，我們就可以通過 sctp_recvmsg API 函數接收一條消息，我們還接收到一個包含流編號的 sctp_sndrcvinfo 結構。這個編號讓我們可以區分開流 0（本地時間）和流 1（GMT）的消息。

SCTP 的未來發展

SCTP 是一個相當新的協議，它在 2000 年 10 月份才成爲一個 RFC 規範。從那以後，它開始進入所有的主流操作系統，包括 GNU/Linux、BSD 和 Solaris。在 Microsoft® Windows® 操作系統上也有第三方的商業包可以使用。

在獲得高可用性的同時，應用程序也已經開始使用 SCTP 作爲自己的主要傳輸機制。諸如 FTP 和 HTTP 之類的傳統應用程序已經在 SCTP 的特性基礎上進行了構建。其他一些協議也正在開始使用 SCTP，例如會話初始化協議（Session Initiation Protocol，SIP）和通用通道信號系統 7（SS7）。在商業領域中，您可以在 Cisco 的 IOS 中找到 SCTP 的影子。

隨着 SCTP 被吸納到 2.6 版本的 Linux 內核中，現在我們可以構建並部署高可用性、高可靠性的網絡應用程序。作爲一種基於 IP 的協議，SCTP 不但可以無縫地替換 TCP 和 UDP，而且擴展了很多新服務，例如多宿主、多流，並且對安全性也有了很大的提高。現在您已經瞭解了 SCTP 的一些高級特性，並且探索了它的一些其他功能。Linux Kernel SCTP 項目（lksctp）提供了可以爲您提供輔助的 API 擴展和文檔。

使用 SCTP 優化網絡

基於Linux平臺的libpcap源代碼分析a

一些開源協議的說明， GPL BSD等等

linux 之top命令詳解

多網卡發送數據包

基於Linux平臺的libpcap源代碼分析c

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結