多線程和進程相比解析

原創

2020-02-24 02:17

使用多線程的理由之一是和進程相比，它是一種非常"節儉"的多任務操作方式。我們知道，在Linux系統下，啓動一個新的進程必須分配給它獨立的地址空間，建立衆多的數據表來維護它的代碼段、堆棧段和數據段，這是一種"昂貴"的多任務工作方式。而運行於一個進程中的多個線程，它們彼此之間使用相同的地址空間，共享大部分數據，啓動一個線程所花費的空間遠遠小於啓動一個進程所花費的空間，而且，線程間彼此切換所需的時間也遠遠小於進程間切換所需要的時間。

　　使用多線程的理由之二是線程間方便的通信機制。對不同進程來說，它們具有獨立的數據空間，要進行數據的傳遞只能通過通信的方式進行，這種方式不僅費時，而且很不方便。線程則不然，由於同一進程下的線程之間共享數據空間，所以一個線程的數據可以直接爲其它線程所用，這不僅快捷，而且方便。當然，數據的共享也帶來其他一些問題，有的變量不能同時被兩個線程所修改，有的子程序中聲明爲static的數據更有可能給多線程程序帶來災難性的打擊，這些正是編寫多線程程序時最需要注意的地方。
1、簡單的多線程程序

首先在主函數中，我們使用到了兩個函數，pthread_create和pthread_join，並聲明瞭一個pthread_t型的變量。
pthread_t在頭文件pthread.h中已經聲明，是線程的標示符

函數pthread_create用來創建一個線程，函數原型：

extern int pthread_create __P ((pthread_t *__thread, __const pthread_attr_t *__attr,void *(*__start_routine) (void *), void *__arg));

　　第一個參數爲指向線程標識符的指針，第二個參數用來設置線程屬性，第三個參數是線程運行函數的起始地址，最後一個參數是運行函數的參數。若我們的函數thread不需要參數，所以最後一個參數設爲空指針。第二個參數我們也設爲空指針，這樣將生成默認屬性的線程。對線程屬性的設定和修改我們將在下一節闡述。當創建線程成功時，函數返回0，若不爲0則說明創建線程失敗，常見的錯誤返回代碼爲EAGAIN和EINVAL。前者表示系統限制創建新的線程，例如線程數目過多了；後者表示第二個參數代表的線程屬性值非法。創建線程成功後，新創建的線程則運行參數三和參數四確定的函數，原來的線程則繼續運行下一行代碼。
函數pthread_join用來等待一個線程的結束。函數原型爲：

　　extern int pthread_join __P ((pthread_t __th, void **__thread_return));

　　第一個參數爲被等待的線程標識符，第二個參數爲一個用戶定義的指針，它可以用來存儲被等待線程的返回值。這個函數是一個線程阻塞的函數，調用它的函數將一直等待到被等待的線程結束爲止，當函數返回時，被等待線程的資源被收回。一個線程的結束有兩種途徑，一種是象我們上面的例子一樣，函數結束了，調用它的線程也就結束了；另一種方式是通過函數pthread_exit來實現。它的函數原型爲：

　　extern void pthread_exit __P ((void *__retval)) __attribute__ ((__noreturn__));

　　唯一的參數是函數的返回代碼，只要pthread_join中的第二個參數thread_return不是NULL，這個值將被傳遞給thread_return。最後要說明的是，一個線程不能被多個線程等待，否則第一個接收到信號的線程成功返回，其餘調用pthread_join的線程則返回錯誤代碼ESRCH。

2、修改線程的屬性
設置線程綁定狀態的函數爲pthread_attr_setscope，它有兩個參數，第一個是指向屬性結構的指針，第二個是綁定類型，它有兩個取值：PTHREAD_SCOPE_SYSTEM（綁定的）和PTHREAD_SCOPE_PROCESS（非綁定的）。下面的代碼即創建了一個綁定的線程。

#include pthread_attr_t attr; pthread_t tid; /*初始化屬性值，均設爲默認值*/ pthread_attr_init(&attr); pthread_attr_setscope(&attr, PTHREAD_SCOPE_SYSTEM); pthread_create(&tid, &attr, (void *) my_function, NULL);
3、線程的數據處理

和進程相比，線程的最大優點之一是數據的共享性，各個進程共享父進程處沿襲的數據段，可以方便的獲得、修改數據。但這也給多線程編程帶來了許多問題。我們必須當心有多個不同的進程訪問相同的變量。許多函數是不可重入的，即同時不能運行一個函數的多個拷貝（除非使用不同的數據段）。在函數中聲明的靜態變量常常帶來問題，函數的返回值也會有問題。因爲如果返回的是函數內部靜態聲明的空間的地址，則在一個線程調用該函數得到地址後使用該地址指向的數據時，別的線程可能調用此函數並修改了這一段數據。在進程中共享的變量必須用關鍵字volatile來定義，這是爲了防止編譯器在優化時（如gcc中使用-OX參數）改變它們的使用方式。爲了保護變量，我們必須使用信號量、互斥等方法來保證我們對變量的正確使用。

4、互斥鎖

互斥鎖用來保證一段時間內只有一個線程在執行一段代碼。必要性顯而易見：假設各個線程向同一個文件順序寫入數據，最後得到的結果一定是災難性的

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

多線程和進程相比解析

mmap之內存映射文件與常規文件操作比較

操作系統概念-----虛擬內存管理

文件系統實現概念

Linux的Ext2文件系統

進程和線程的區別是什麼？-來自知乎高贊回答

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結