sockaddr sockaddr_in詳解

收件人地址

        一家化妝品公司將一批新產品的樣品,準備發給某學校某個班的女生們免費試用。通常情況下,這件郵包的地址上可以這麼寫:
收件人:全體女生。
地址:A省B市C學校,X級Y班。
但是,如果在描述地址的時候這樣寫呢:
收件人:全體女生。
地址:請打電話xxxxxxxx,找他們學校一個叫Lucy的女生,然後把東西送到她的班上。
這種文字是相當的詭異啊-_-!!!,但是並不等於就沒有表述清楚郵包的去向和地址。事實上郵局看到這樣的地址一定會發飆的,然而對於電腦,如果你的地址描述形式是他可以接受和執行的,他就會老老實實的按你的要求去做……
        所以,如何描述地址不是問題的關鍵,關鍵在於這樣的表述是不是能夠表述清楚一個地址。一種更加通用的表達形式可能是這樣的:
收件人:全體女生。
地址:
<一種地址描述方式>
        事實上,在socket的通用address描述結構sockaddr中正是用這樣的方式來進行地址描述的:
struct sockaddr
{
    unsigned 
short sa_family;
    
char sa_data[14];
};
這是一個16字節大小的結構(2+14),sa_family可以認爲是socket address family的縮寫,也可能被簡寫成AF(Address Family),他就好像我們例子中那個“收件人:全體女生”一樣,雖然事實上有很多AF的種類,但是我們這個教程中只用得上大名鼎鼎的internet家族AF_INET。另外的14字節是用來描述地址的。這是一種通用結構,事實上,當我們指定sa_family=AF_INET之後,sa_data的形式也就被固定了下來:最前端的2字節用於記錄16位的端口,緊接着的4字節用於記錄32位的IP地址,最後的8字節清空爲零。這就是我們實際在構造sockaddr時候用到的結構sockaddr_in(意指socket address internet):
struct sockaddr_in
{
    unsigned 
short sin_family;
    unsigned 
short sin_port;
    
struct in_addr sin_addr;
    
char sin_zero[8];
};
我想,sin_的意思,就是socket (address) internet吧,只不過把address省略掉了。sin_addr被定義成了一個結構,這個結構實際上就是:
struct in_addr
{
    unsigned 
long s_addr;
};
in_addr顯然是internet address了,s_addr是什麼意思呢?說實話我沒猜出值得肯定的答案(根據下面網友的評論,其意思爲source address,謝謝),也許就是socket address的意思吧,儘管跟更廣義的sockaddr結構意思有所重複了。哎,這些都是歷史原因,也許我是沒有精力去考究了。

sockaddr和sockaddr_in在Linux中的實現

        你可能還記得我之前說過,UNIX和Linux上的socket實現都是從BSD的socket實現演變過來的。事實上,socket這個詞本來的意思,就是Berkeley Socket interface的簡單說法。Linux上的socket與原本的socket的應該是完全兼容的,不過發展到今天,在代碼實現上可能有些小的差別。我們就吹毛求疵的來看看這些區別在什麼地方。
#include <bits/socket.h>

/* Structure describing a generic socket address.  */
struct sockaddr
  {
    __SOCKADDR_COMMON (sa_);    
/* Common data: address family and length.  */
    
char sa_data[14];        /* Address data.  */
  };

//==============

/* POSIX.1g specifies this type name for the `sa_family' member.  */
typedef unsigned 
short int sa_family_t;

/* This macro is used to declare the initial common members
   of the data types used for socket addresses, `struct sockaddr',
   `struct sockaddr_in', `struct sockaddr_un', etc.  
*/

#define    __SOCKADDR_COMMON(sa_prefix) \
  sa_family_t sa_prefix##family

#define __SOCKADDR_COMMON_SIZE    (sizeof (unsigned short int))
可以看到,轉了幾次typedef,幾次宏定義,實際效果是與標準socket一樣的。
#include <netinet/in.h>

/* Internet address.  */
typedef uint32_t in_addr_t;
struct in_addr
  {
    in_addr_t s_addr;
  };

//=================

/* Structure describing an Internet socket address.  */
struct sockaddr_in
  {
    __SOCKADDR_COMMON (sin_);
    in_port_t sin_port;            
/* Port number.  */
    
struct in_addr sin_addr;        /* Internet address.  */

    
/* Pad to size of `struct sockaddr'.  */
    unsigned 
char sin_zero[sizeof (struct sockaddr) -
               __SOCKADDR_COMMON_SIZE 
-
               
sizeof (in_port_t) -
               
sizeof (struct in_addr)];
  };
同樣的,看起來挺複雜,實際上與標準socket的定義是一樣的。

頭文件依賴關係
        <bits/socket.h>是包含在<sys/socket.h>中的,<netinet/in.h>是包含在<arpa/inet.h>中的,實際上我們在程序中往往就是:
#include <sys/socket.h>
#include 
<arpa/inet.h>

值得知道的是,ARPA是 Advanced research project agency(美國國防部高級研究計劃暑)的所寫,ARPANET是當今互聯網的前身,所以我們就可以想象,爲什麼inet.h會在arpa目錄下了。

原文出處:http://www.cppblog.com/lf426/archive/2008/07/10/55800.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章