UNIX網絡編程——socket概述和字節序、地址轉換函數

一、什麼是socket

socket可以看成是用戶進程與內核網絡協議棧的編程接口。
socket不僅可以用於本機的進程間通信，還可以用於網絡上不同主機的進程間通信。

socket API是一層抽象的網絡編程接口，適用於各種底層網絡協議，如IPv4、IPv6，以及以後要講的UNIX Domain Socket。然而，各種網絡協議的地址格式並不相同，如下圖所示：

IPv4和IPv6的地址格式定義在netinet/in.h中，IPv4地址用sockaddr_in結構體表示，包括16位端口號和32位IP地址，如下所示：

[cpp]view
plaincopyprint?

struct sockaddr_in {  

        uint8_t        sin_len; /*length of structure (16)*/  

        sa_family_t    sin_family; /* address family: AF_INET */  

        in_port_t      sin_port;   /* port in network byte order */  

        struct in_addr sin_addr;   /* internet address */  

        char           sin_zero[8]; /* pad bytes,  set to zero is ok */  

};

[cpp]view
plaincopyprint?

struct in_addr{  

        in_addr_t s_addr; /*32-bit IPV4 address*/  

};  

sa_family_t是一個無符號短整型（unsigned short）。in_addr_t數據類型必須是一個至少32位的無符號整數類型，in_port_t必須是一個至少16位的無符號的整數類型。

IPv6地址用sockaddr_in6結構體表示，包括16位端口號、128位IP地址和一些控制字段。UNIX Domain Socket的地址格式定義在sys/un.h中，用sockaddr_un結構體表示。各種socket地址結構體的開頭都是相同的，前16位表示整個結構體的長度（並不是所有UNIX的實現都有長度字段，如Linux就沒有），後16位表示地址類型。IPv4、IPv6和UNIX Domain Socket的地址類型分別定義爲常數AF_INET、AF_INET6、AF_UNIX。這樣，只要取得某種sockaddr結構體的首地址，不需要知道具體是哪種類型的sockaddr結構體，就可以根據地址類型字段確定結構體中的內容。因此，socket API可以接受各種類型的sockaddr結構體指針做參數，例如bind、accept、connect等函數，這些函數的參數應該設計成void *類型以便接受各種類型的指針，但是sock API的實現早於ANSI C標準化，那時還沒有void *類型，因此這些函數的參數都用struct sockaddr *類型表示，即通用地址結構，如下所示：

[cpp]view
plaincopyprint?

struct sockaddr {  

        uint8_t      sa_len;  

        sa_family_t  sin_family;  

        char         sa_data[14];  

};

sin_family：指定該地址家族
sa_data：由sin_family決定它的形式。

在傳遞參數之前要強制類型轉換一下，例如：

struct sockaddr_in servaddr;

/* initialize servaddr *

/bind(listen_fd, (struct sockaddr *)&servaddr, sizeof(servaddr));

二、網絡字節序

字節序
大端字節序（Big Endian)
最高有效位（MSB：Most Significant Bit）存儲於最低內存地址處，最低有效位（LSB：Lowest Significant Bit）存儲於最高內存地址處。
小端字節序（Little Endian）
最高有效位（MSB：Most Significant Bit）存儲於最高內存地址處，最低有效位（LSB：Lowest Significant Bit）存儲於最低內存地址處。
主機字節序
不同的主機有不同的字節序，如x86爲小端字節序，Motorola 6800爲大端字節序，ARM字節序是可配置的。

網絡字節序
網絡字節序規定爲大端字節序

爲使網絡程序具有可移植性，使同樣的C代碼在大端和小端計算機上編譯後都能正常運行，可以調用以下庫函數做網絡字節序和主機字節序的轉換。

[cpp]view
plaincopyprint?

#include <arpa/inet.h>  

uint32_t htonl(uint32_t hostlong);  

uint16_t htons(uint16_t hostshort);  

uint32_t ntohl(uint32_t netlong);  

uint16_t ntohs(uint16_t netshort);

這些函數名很好記，h表示host，n表示network，l表示32位長整數，s表示16位短整數。例如htonl表示將32位的長整數從主機字節序轉換爲網絡字節序，例如將IP地址轉換後準備發送。如果主機是小端字節序，這些函數將參數做相應的大小端轉換然後返回，如果主機是大端字節序，這些函數不做轉換，將參數原封不動地返回。

下面寫個小程序測試下主機的大小端：

[cpp]view
plaincopyprint?

#include<stdio.h>  

#include<arpa/inet.h>  

int main(void)  

{  

    unsigned int x = 0x12345678;  

    unsigned char *p = (unsigned char *)&x;  

    printf("%x %x %x %x\n", p[0], p[1], p[2], p[3]);  

    unsigned int y = htonl(x);  

    p = (unsigned char *)&y;  

    printf("%x %x %x %x\n", p[0], p[1], p[2], p[3]);  

    return 0;  

}

運行結果：

[cpp]view
plaincopyprint?

huangcheng@ubuntu:~$ ./a.out  

78 56 34 12  

12 34 56 78  

即本主機是小端字節序，而經過htonl 轉換後爲網絡字節序，即大端。

三、地址轉換函數

前面提到的 sockaddr_in 結構體中的成員struct in_addr sin_addr表示32位的IP地址。但是我們通常用點分十進制的字符串表示IP地址，以下函數可以在字符串表示和in_addr表示之間轉換。

字符串轉in_addr的函數：

[cpp]view
plaincopyprint?

#include <arpa/inet.h>  

int inet_aton(const char *strptr, struct in_addr *addrptr);  

in_addr_t inet_addr(const char *strptr);  

int inet_pton(int family, const char *strptr, void *addrptr);  

注意：轉換而成的32位數是網絡字節序的。
in_addr轉字符串的函數：

[cpp]view
plaincopyprint?

char *inet_ntoa(struct in_addr inaddr);  

const char *inet_ntop(int family, const void *addrptr, char *strptr, size_t len);  

注意：傳入的32位數也是網絡字節序的。
其中inet_pton和inet_ntop不僅可以轉換IPv4的in_addr，還可以轉換IPv6的in6_addr，因此函數接口是void *addrptr。

下面寫個小程序演示一下：

[cpp]view
plaincopyprint?

#include<stdio.h>  

#include<arpa/inet.h>  

int main(void)  

{  

    unsigned int  addr = inet_addr("192.168.0.100"); //轉換後是網絡字節序（大端）  

    printf("add=%u\n", ntohl(addr));  

    struct in_addr ipaddr;  

    ipaddr.s_addr = addr;  

    printf("%s\n", inet_ntoa(ipaddr));  

    return 0;  

}

運行結果：

[cpp]view
plaincopyprint?

huangcheng@ubuntu:~$ ./a.out  

add=3232235620  

192.168.0.100  

注意，在打印addr的時候先轉換成主機字節序，否則輸出可能是負數。

四、套接字類型

流式套接字(SOCK_STREAM)
提供面向連接的、可靠的數據傳輸服務，數據無差錯，無重複的發送，且按發送順序接收。
數據報式套接字(SOCK_DGRAM)
提供無連接服務。不提供無錯保證，數據可能丟失或重複，並且接收順序混亂。
原始套接字（SOCK_RAW）

UNIX網絡編程——socket概述和字節序、地址轉換函數

Wireshark 安裝+使用（一）

GDB調試多進程的fork+exec

UNIX網絡編程——SOCKET API和TCP STATE的對應關係_三次握手_四次揮手及TCP延遲確認

ubuntu下配置NFS和TFTP連接omapl-138開發板

UNIX網絡編程——產生RST

UNIX網絡編程——shutdown 與 close 函數的區別

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結