socket概述和字節序、地址轉換函數(六)

一、什麼是socket

socket可以看成是用戶進程內核網絡協議棧的編程接口。

socket API是一層抽象的網絡編程接口,適用於各種底層網絡協議,如IPv4、IPv6,以及UNIX Domain Socket。然而,各種網絡協議的地址格式並不相同,如下圖所示:

IPv4和IPv6的地址格式定義在/usr/include/netinet/in.h中,IPv4地址用sockaddr_in結構體表示,

包括16位端口號和32位IP地址,如下所示:


struct sockaddr_in
  {
    __SOCKADDR_COMMON (sin_);
    in_port_t sin_port;			/* Port number.  */
    struct in_addr sin_addr;		/* Internet address.  */

    /* Pad to size of `struct sockaddr'.  */
    unsigned char sin_zero[sizeof (struct sockaddr) -
			   __SOCKADDR_COMMON_SIZE -
			   sizeof (in_port_t) -
			   sizeof (struct in_addr)];
  };


struct sockaddr_in6
  {
    __SOCKADDR_COMMON (sin6_);
    in_port_t sin6_port;	/* Transport layer port # */
    uint32_t sin6_flowinfo;	/* IPv6 flow information */
    struct in6_addr sin6_addr;	/* IPv6 address */
    uint32_t sin6_scope_id;	/* IPv6 scope-id */
  };

   struct sockaddr_in {
               sa_family_t    sin_family; /* address family: AF_INET */
               in_port_t      sin_port;   /* port in network byte order */
               struct in_addr sin_addr;   /* internet address */
char sin_zero[8]; /* pad bytes,  set to zero is ok */
           };

  /* Internet address. */
           struct in_addr {
               uint32_t       s_addr;     /* address in network byte order */
           };

各種socket地址結構體的開頭都是相同的,前16位表示整個結構體的長度(並不是所有UNIX的實現都有長度字段,如Linux就沒有),後16位表示地址類型。IPv4、IPv6和UNIX Domain Socket的地址類型分別定義爲常數AF_INET、AF_INET6、AF_UNIX。這樣,只要取得某種sockaddr結構體的首地址,不需要知道具體是哪種類型的sockaddr結構體,就可以根據地址類型字段確定結構體中的內容。因此,socket API可以接受各種類型的sockaddr結構體指針做參數,例如bind、accept、connect等函數,這些函數的參數應該設計成void *類型以便接受各種類型的指針,但是sock API的實現早於ANSI C標準化,那時還沒有void *類型,因此這些函數的參數都用struct sockaddr *類型表示,即通用地址結構,如下所示:

struct sockaddr {
sa_family_t  sin_family;
char sa_data[14];
}; 

sin_family:指定該地址家族
sa_data:由sin_family決定它的形式。


在傳遞參數之前要強制類型轉換一下,例如:

struct sockaddr_in servaddr;

/* initialize servaddr */

bind(listen_fd, (struct sockaddr *)&servaddr, sizeof(servaddr));


二、網絡字節序

字節序
大端字節序(Big Endian)
最高有效位(MSB:Most Significant Bit)存儲於最低內存地址處,最低有效位(LSB:Lowest Significant Bit)存儲於最高內存地址處。
小端字節序(Little Endian)
最高有效位(MSB:Most Significant Bit)存儲於最高內存地址處,最低有效位(LSB:Lowest Significant Bit)存儲於最低內存地址處。
主機字節序
不同的主機有不同的字節序,如x86爲小端字節序,Motorola 6800爲大端字節序,ARM字節序是可配置的。

網絡字節序
網絡字節序規定爲大端字節序

爲使網絡程序具有可移植性,使同樣的C代碼在大端和小端計算機上編譯後都能正常運行,可以調用以下庫函數做網絡字節序和主機字節序的轉換。


#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);

其中,h表示host,n表示network,l表示32位長整數,s表示16位短整數。例如htonl表示將32位的長整數從主機字節序轉換爲網絡字節序,例如將IP地址轉換後準備發送。如果主機是小端字節序,這些函數將參數做相應的大小端轉換然後返回,如果主機是大端字節序,這些函數不做轉換,將參數原封不動地返回。


三、地址轉換函數

 sockaddr_in 結構體中的成員struct in_addr sin_addr表示32位的IP地址。但是我們通常用點分十進制的字符串表示IP地址,以下函數可以在字符串表示和in_addr表示之間轉換。


字符串轉in_addr的函數:

#include <arpa/inet.h>
int inet_aton(const char *strptr, struct in_addr *addrptr);
in_addr_t inet_addr(const char *strptr);
int inet_pton(int family, const char *strptr, void *addrptr);

a: 字符串

n: network

注意,轉換而成的32位數是網絡字節序的。



in_addr轉字符串的函數:

char *inet_ntoa(struct in_addr inaddr);
const char *inet_ntop(int family, const void *addrptr, char *strptr, size_t len);


注意,傳入的32位數也是網絡字節序的。

其中inet_pton和inet_ntop不僅可以轉換IPv4的in_addr,還可以轉換IPv6的in6_addr,因此函數接口是void *addrptr。


四、套接字類型

流式套接字(SOCK_STREAM)
提供面向連接的、可靠的數據傳輸服務,數據無差錯,無重複的發送,且按發送順序接收。
數據報式套接字(SOCK_DGRAM)
提供無連接服務。不提供無錯保證,數據可能丟失或重複,並且接收順序混亂。
原始套接字(SOCK_RAW)




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章