Linux下Socket編程

什麼是Socket
   Socket接口是TCP/IP網絡的API,Socket接口定義了許多函數或例程,程序員可以用它們來開發TCP/IP網絡上的應用程序。要學Internet上的TCP/IP網絡編程,必須理解Socket接口。
    Socket接口設計者最先是將接口放在Unix操作系統裏面的。如果瞭解Unix系統的輸入和輸出的話,就很容易瞭解Socket了。網絡的 Socket數據傳輸是一種特殊的I/O,Socket也是一種文件描述符。Socket也具有一個類似於打開文件的函數調用Socket(),該函數返 回一個整型的Socket描述符,隨後的連接建立、數據傳輸等操作都是通過該Socket實現的。常用的Socket類型有兩種:流式Socket (SOCK_STREAM)和數據報式Socket(SOCK_DGRAM)。流式是一種面向連接的Socket,針對於面向連接的TCP服務應用;數據 報式Socket是一種無連接的Socket,對應於無連接的UDP服務應用。

 

Socket建立
  爲了建立Socket,程序可以調用Socket函數,該函數返回一個類似於文件描述符的句柄。socket函數原型爲:

     

  domain指明所使用的協議族,通常爲AF_INET,表示互聯網協議族(TCP/IP協議族);type參數指定socket的類型: SOCK_STREAM 或SOCK_DGRAM,Socket接口還定義了原始Socket(SOCK_RAW),允許程序使用低層協議;protocol通常賦值"0"。 Socket()調用返回一個整型socket描述符,你可以在後面的調用使用它。
   Socket描述符是一個指向內部數據結構的指針,它指向描述符表入口。調用Socket函數時,socket執行體將建立一個Socket,實際上"建立一個Socket"意味着爲一個Socket數據結構分配存儲空間。Socket執行體爲你管理描述符表。
  兩個網絡程序之間的一個網絡連接包括五種信息:通信協議、本地協議地址、本地主機端口、遠端主機地址和遠端協議端口。Socket數據結構中包含這五種信息。

 

Socket配置
   通過socket調用返回一個socket描述符後,在使用socket進行網絡傳輸以前,必須配置該socket。面向連接的socket客戶端通過 調用Connect函數在socket數據結構中保存本地和遠端信息。無連接socket的客戶端和服務端以及面向連接socket的服務端通過調用 bind函數來配置本地信息。
Bind函數將socket與本機上的一個端口相關聯,隨後你就可以在該端口監聽服務請求。Bind函數原型爲:
   int bind(int sockfd,struct sockaddr *my_addr, int addrlen);
   Sockfd是調用socket函數返回的socket描述符,my_addr是一個指向包含有本機IP地址及端口號等信息的sockaddr類型的指針;addrlen常被設置爲sizeof(struct sockaddr)。
   struct sockaddr結構類型是用來保存socket信息的:
   struct sockaddr {
   unsigned short sa_family; /* 地址族, AF_xxx */
char sa_data[14]; /* 14 字節的協議地址 */
};
   sa_family一般爲AF_INET,代表Internet(TCP/IP)地址族;sa_data則包含該socket的IP地址和端口號。
   另外還有一種結構類型:
   struct sockaddr_in {
   short int sin_family; /* 地址族 */
   unsigned short int sin_port; /* 端口號 */
   struct in_addr sin_addr; /* IP地址 */
   unsigned char sin_zero[8]; /* 填充0 以保持與struct sockaddr同樣大小 */
   };
   這個結構更方便使用。sin_zero用來將sockaddr_in結構填充到與struct sockaddr同樣的長度,可以用bzero()或memset()函數將其置爲零。指向sockaddr_in 的指針和指向sockaddr的指針可以相互轉換,這意味着如果一個函數所需參數類型是sockaddr時,你可以在函數調用的時候將一個指向 sockaddr_in的指針轉換爲指向sockaddr的指針;或者相反。
  使用bind函數時,可以用下面的賦值實現自動獲得本機IP地址和隨機獲取一個沒有被佔用的端口號:
   my_addr.sin_port = 0; /* 系統隨機選擇一個未被使用的端口號 */
   my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本機IP地址 */
通過將my_addr.sin_port置爲0,函數會自動爲你選擇一個未佔用的端口來使用。同樣,通過將my_addr.sin_addr.s_addr置爲INADDR_ANY,系統會自動填入本機IP地址。
注意在使用bind函數是需要將sin_port和sin_addr轉換成爲網絡字節優先順序;而sin_addr則不需要轉換。
  計算機數據存儲有兩種字節優先順序:高位字節優先和低位字節優先。Internet上數據以高位字節優先順序在網絡上傳輸,所以對於在內部是以低位字節優先方式存儲數據的機器,在Internet上傳輸數據時就需要進行轉換,否則就會出現數據不一致。
   下面是幾個字節順序轉換函數:
·htonl():把32位值從主機字節序轉換成網絡字節序
·htons():把16位值從主機字節序轉換成網絡字節序
·ntohl():把32位值從網絡字節序轉換成主機字節序
·ntohs():把16位值從網絡字節序轉換成主機字節序
   Bind()函數在成功被調用時返回0;出現錯誤時返回"-1"並將errno置爲相應的錯誤號。需要注意的是,在調用bind函數時一般不要將端口號置爲小於1024的值,因爲1到1024是保留端口號,你可以選擇大於1024中的任何一個沒有被佔用的端口號。

連接建立
  面向連接的客戶程序使用Connect函數來配置socket並與遠端服務器建立一個TCP連接,其函數原型爲:
   int connect(int sockfd, struct sockaddr *serv_addr,int addrlen);
Sockfd 是socket函數返回的socket描述符;serv_addr是包含遠端主機IP地址和端口號的指針;addrlen是遠端地質結構的長度。 Connect函數在出現錯誤時返回-1,並且設置errno爲相應的錯誤碼。進行客戶端程序設計無須調用bind(),因爲這種情況下只需知道目的機器 的IP地址,而客戶通過哪個端口與服務器建立連接並不需要關心,socket執行體爲你的程序自動選擇一個未被佔用的端口,並通知你的程序數據什麼時候到 打斷口。
   Connect函數啓動和遠端主機的直接連接。只有面向連接的客戶程序使用socket時才需要將此socket與遠端主機相連。無連接協議從不建立直接連接。面向連接的服務器也從不啓動一個連接,它只是被動的在協議端口監聽客戶的請求。
   Listen函數使socket處於被動的監聽模式,併爲該socket建立一個輸入數據隊列,將到達的服務請求保存在此隊列中,直到程序處理它們。
   int listen(int sockfd, int backlog);
Sockfd 是Socket系統調用返回的socket 描述符;backlog指定在請求隊列中允許的最大請求數,進入的連接請求將在隊列中等待accept()它們(參考下文)。Backlog對隊列中等待 服務的請求的數目進行了限制,大多數系統缺省值爲20。如果一個服務請求到來時,輸入隊列已滿,該socket將拒絕連接請求,客戶將收到一個出錯信息。
當出現錯誤時listen函數返回-1,並置相應的errno錯誤碼。
   accept()函數讓服務器接收客戶的連接請求。在建立好輸入隊列後,服務器就調用accept函數,然後睡眠並等待客戶的連接請求。
   int accept(int sockfd, void *addr, int *addrlen);
    sockfd是被監聽的socket描述符,addr通常是一個指向sockaddr_in變量的指針,該變量用來存放提出連接請求服務的主機的信息(某 臺主機從某個端口發出該請求);addrten通常爲一個指向值爲sizeof(struct sockaddr_in)的整型指針變量。出現錯誤時accept函數返回-1並置相應的errno值。
  首先,當accept函數監視的 socket收到連接請求時,socket執行體將建立一個新的socket,執行體將這個新socket和請求連接進程的地址聯繫起來,收到服務請求的 初始socket仍可以繼續在以前的 socket上監聽,同時可以在新的socket描述符上進行數據傳輸操作。

數據傳輸
   Send()和recv()這兩個函數用於面向連接的socket上進行數據傳輸。
   Send()函數原型爲:
   int send(int sockfd, const void *msg, int len, int flags);
Sockfd是你想用來傳輸數據的socket描述符;msg是一個指向要發送數據的指針;Len是以字節爲單位的數據的長度;flags一般情況下置爲0(關於該參數的用法可參照man手冊)。
   Send()函數返回實際上發送出的字節數,可能會少於你希望發送的數據。在程序中應該將send()的返回值與欲發送的字節數進行比較。當send()返回值與len不匹配時,應該對這種情況進行處理。
char *msg = "Hello!";
int len, bytes_sent;
……
len = strlen(msg);
bytes_sent = send(sockfd, msg,len,0);
……
   recv()函數原型爲:
   int recv(int sockfd,void *buf,int len,unsigned int flags);
   Sockfd是接受數據的socket描述符;buf 是存放接收數據的緩衝區;len是緩衝的長度。Flags也被置爲0。Recv()返回實際上接收的字節數,當出現錯誤時,返回-1並置相應的errno值。
Sendto()和recvfrom()用於在無連接的數據報socket方式下進行數據傳輸。由於本地socket並沒有與遠端機器建立連接,所以在發送數據時應指明目的地址。
sendto()函數原型爲:
   int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);
  該函數比send()函數多了兩個參數,to表示目地機的IP地址和端口號信息,而tolen常常被賦值爲sizeof (struct sockaddr)。Sendto 函數也返回實際發送的數據字節長度或在出現發送錯誤時返回-1。
   Recvfrom()函數原型爲:
   int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);
    from是一個struct sockaddr類型的變量,該變量保存源機的IP地址及端口號。fromlen常置爲sizeof (struct sockaddr)。當recvfrom()返回時,fromlen包含實際存入from中的數據字節數。Recvfrom()函數返回接收到的字節數或 當出現錯誤時返回-1,並置相應的errno。
如果你對數據報socket調用了connect()函數時,你也可以利用send()和recv()進行數據傳輸,但該socket仍然是數據報socket,並且利用傳輸層的UDP服務。但在發送或接收數據報時,內核會自動爲之加上目地和源地址信息。

結束傳輸
  當所有的數據操作結束以後,你可以調用close()函數來釋放該socket,從而停止在該socket上的任何數據操作:
close(sockfd);
  你也可以調用shutdown()函數來關閉該socket。該函數允許你只停止在某個方向上的數據傳輸,而一個方向上的數據傳輸繼續進行。如你可以關閉某socket的寫操作而允許繼續在該socket上接受數據,直至讀入所有數據。
   int shutdown(int sockfd,int how);
   Sockfd是需要關閉的socket的描述符。參數 how允許爲shutdown操作選擇以下幾種方式:
   ·0-------不允許繼續接收數據
   ·1-------不允許繼續發送數據
   ·2-------不允許繼續發送和接收數據,
   ·均爲允許則調用close ()
   shutdown在操作成功時返回0,在出現錯誤時返回-1並置相應errno。

Socket編程實例
   代碼實例中的服務器通過socket連接向客戶端發送字符串"Hello, you are connected!"。只要在服務器上運行該服務器軟件,在客戶端運行客戶軟件,客戶端就會收到該字符串。
   該服務器軟件代碼如下:

      
   服務器的工作流程是這樣的:首先調用socket函數創建一個Socket,然後調用bind函數將其與本機地址以及一個本地端口號綁定,然後調用 listen在相應的socket上監聽,當accpet接收到一個連接服務請求時,將生成一個新的socket。服務器顯示該客戶機的IP地址,並通過 新的socket向客戶端發送字符串"Hello,you are connected!"。最後關閉該socket。
  代碼實例中的fork()函數生成一個子進程來處理數據傳輸部分,fork()語句對於子進程返回的值爲0。所以包含fork函數的if語句是子進程代碼部分,它與if語句後面的父進程代碼部分是併發執行的。

客戶端程序代碼如下:

     
  客戶端程序首先通過服務器域名獲得服務器的IP地址,然後創建一個socket,調用connect函數與服務器建立連接,連接成功之後接收從服務器發送過來的數據,最後關閉socket。
  函數gethostbyname()是完成域名轉換的。由於IP地址難以記憶和讀寫,所以爲了方便,人們常常用域名來表示主機,這就需要進行域名和IP地址的轉換。函數原型爲:
   struct hostent *gethostbyname(const char *name);
   函數返回爲hosten的結構類型,它的定義如下:
   struct hostent {
  char *h_name; /* 主機的官方域名 */
   char **h_aliases; /* 一個以NULL結尾的主機別名數組 */
   int h_addrtype; /* 返回的地址類型,在Internet環境下爲AF-INET */
   int h_length; /* 地址的字節長度 */
   char **h_addr_list; /* 一個以0結尾的數組,包含該主機的所有地址*/
   };
   #define h_addr h_addr_list[0] /*在h-addr-list中的第一個地址*/
   當 gethostname()調用成功時,返回指向struct hosten的指針,當調用失敗時返回-1。當調用gethostbyname時,你不能使用perror()函數來輸出錯誤信息,而應該使用herror()函數來輸出。

  無連接的客戶/服務器程序的在原理上和連接的客戶/服務器是一樣的,兩者的區別在於無連接的客戶/服務器中的客戶一般不需要建立連接,而且在發送接收數據時,需要指定遠端機的地址。

阻塞和非阻塞
   阻塞函數在完成其指定的任務以前不允許程序調用另一個函數。例如,程序執行一個讀數據的函數調用時,在此函數完成讀操作以前將不會執行下一程序語句。當 服務器運行到accept語句時,而沒有客戶連接服務請求到來,服務器就會停止在accept語句上等待連接服務請求的到來。這種情況稱爲阻塞 (blocking)。而非阻塞操作則可以立即完成。比如,如果你希望服務器僅僅注意檢查是否有客戶在等待連接,有就接受連接,否則就繼續做其他事情,則 可以通過將Socket設置爲非阻塞方式來實現。非阻塞socket在沒有客戶在等待時就使accept調用立即返回。
   #include <unistd.h>
   #include <fcntl.h>
   ……
sockfd = socket(AF_INET,SOCK_STREAM,0);
fcntl(sockfd,F_SETFL,O_NONBLOCK);
……
   通過設置socket爲非阻塞方式,可以實現"輪詢"若干Socket。當企圖從一個沒有數據等待處理的非阻塞Socket讀入數據時,函數將立即返 回,返回值爲-1,並置errno值爲EWOULDBLOCK。但是這種"輪詢"會使CPU處於忙等待方式,從而降低性能,浪費系統資源。而調用 select()會有效地解決這個問題,它允許你把進程本身掛起來,而同時使系統內核監聽所要求的一組文件描述符的任何活動,只要確認在任何被監控的文件 描述符上出現活動,select()調用將返回指示該文件描述符已準備好的信息,從而實現了爲進程選出隨機的變化,而不必由進程本身對輸入進行測試而浪費 CPU開銷。Select函數原型爲:
int select(int numfds,fd_set *readfds,fd_set *writefds,
fd_set *exceptfds,struct timeval *timeout);
   其中readfds、writefds、exceptfds分別是被select()監視的讀、寫和異常處理的文件描述符集合。如果你希望確定是否可以 從標準輸入和某個socket描述符讀取數據,你只需要將標準輸入的文件描述符0和相應的sockdtfd加入到readfds集合中;numfds的值 是需要檢查的號碼最高的文件描述符加1,這個例子中numfds的值應爲sockfd+1;當select返回時,readfds將被修改,指示某個文件 描述符已經準備被讀取,你可以通過FD_ISSSET()來測試。爲了實現fd_set中對應的文件描述符的設置、復位和測試,它提供了一組宏:
   FD_ZERO(fd_set *set)----清除一個文件描述符集;
   FD_SET(int fd,fd_set *set)----將一個文件描述符加入文件描述符集中;
   FD_CLR(int fd,fd_set *set)----將一個文件描述符從文件描述符集中清除;
   FD_ISSET(int fd,fd_set *set)----試判斷是否文件描述符被置位。
   Timeout參數是一個指向struct timeval類型的指針,它可以使select()在等待timeout長時間後沒有文件描述符準備好即返回。struct timeval數據結構爲:
   struct timeval {
   int tv_sec; /* seconds */
   int tv_usec; /* microseconds */
};

POP3客戶端實例
  下面的代碼實例基於POP3的客戶協議,與郵件服務器連接並取回指定用戶帳號的郵件。與郵件服務器交互的命令存儲在字符串數組POPMessage中,程序通過一個do-while循環依次發送這些命令。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章