管道是Linux由Unix那裏繼承過來的進程間的通信機制,它是Unix早期的一個重要通信機制。其思想是,在內存中創建一個共享文件,從而使通信雙方利用這個共享文件來傳遞信息。由於這種方式具有單向傳遞數據的特點,所以這個作爲傳遞消息的共享文件就叫做“管道”。
在管道的具體實現中,根據通信所使用的的文件是否具有名稱,有“匿名管道”和“命名管道”。
管道與共享內存的區別
乍一看,感覺管道和共享內存並不是區別很大,這裏介紹一下兩者之間的區別:
- 管道需要在內核和用戶空間進行四次的數據拷貝:由用戶空間的buf中將數據拷貝到內核中 -> 內核將數據拷貝到內存中 -> 內存到內核 -> 內核到用戶空間的buf。而共享內存則只拷貝兩次數據:用戶空間到內存 -> 內存到用戶空間。
- 管道用循環隊列實現,連續傳送數據可以不限大小。共享內存每次傳遞數據大小是固定的;
- 共享內存可以隨機訪問被映射文件的任意位置,管道只能順序讀寫;
- 管道可以獨立完成數據的傳遞和通知機制,共享內存需要藉助其他通訊方式進行消息傳遞。
也就是說,兩者之間最大的區別就是: 共享內存區是最快的可用IPC形式,一旦這樣的內存區映射到共享它的進程的地址空間,這些進程間數據的傳遞,就不再通過執行任何進入內核的系統調用來傳遞彼此的數據,節省了時間。
匿名管道
匿名管道是在具有公共祖先的進程之間進行通信的一種方式。
前面在介紹進程的創建時講到,由父進程創建的子進程將會賦值父進程包括文件在內的一些資源。如果父進程創建子進程之前創建了一個文件,那麼這個文件的描述符就會被父進程在隨後所創建的子進程所共享。也就是說,父、子進程可以通過這個文件進行通信。如果通信的雙方一方只能進行讀操作,而另一方只能進行寫操作,那麼這個文件就是一個只能單方向傳送消息的管道,如下圖所示:
進程可以通過調用函數pipe()創建一個管道。函數pipe()的原型如下:
int pipe(int fildes[2]);
與該函數pipe()相對應的系統調用sys_pipe()的原型如下:
asmlinkage int sys_pipe(unsigned long __user * fildes);
從本質上來說,pipe()函數的功能就是創建一個內存文件,但與創建普通文件的函數不同,函數pipe()將在參數fildes中爲進程返回這個文件的兩個文件描述符fildes[0]和fildes[1]。其中,fildes[0]是一個具有“只讀”屬性的文件描述符,fildes[1]是一個具有“只寫”屬性的文件描述符,即進程通過fildes[0]只能進行文件的讀操作,而通過fildes[1]只能進行文件的寫操作。
這樣,就使得這個文件像一段只能單向流通的管道一樣,一頭專門用來輸入數據,另一頭專門用來輸出數據,所以稱爲管道。由於這種文件沒有文件名,不能被非親進程所打開,只能用於親屬進程間的通信,所以這種沒有名稱的文件形成的通信管道叫做“匿名管道”。
顯然,如果父進程創建的這種文件只是用來通信,那麼它感興趣的只是該文件所佔用的內存空間,所以也就沒有必要創建一個正式文件,只需創建一個只存在於內存的臨時文件。從這一點來看,匿名管道與共享內存具有共同點,只不過匿名管道時單向通信,而且這個通信只能在親屬進程間進行。
爲支持匿名管道,內核初始化時由內核函數kernel_mount()安裝了一種特殊的文件系統,在該系統中所創建的都是臨時文件。
由於匿名管道是一個文件,所以它也有i節點,其結構如下:
struct inode
{
...
struct file_operations *i_fop; //文件操作函數集
struct pipe_inode_info *i_pipe; //管道文件指針
...
};
可以看到,在i節點的結構中有一個pipe_inode_info類型的指針i_pipe,在普通文件中這個指針的值爲NULL,而在管道文件中這個指針則只想一個叫做管道節點信息結構的pipe_inode_info,以表明這是一個管道文件。pipe_inode_info的結構如下:
struct pipe_inode_info {
wait_queue_head_t wait; //等待進程隊列
unsigned int nrbufs, curbuf;
struct page *tmp_page;
unsigned int readers;
unsigned int writers;
unsigned int waiting_writers;
unsigned int r_counter; //以只讀方式訪問管道的進程計數器
unsigned int w_counter; //以只寫方式訪問管道的進程計數器
struct fasync_struct *fasync_readers;
struct fasync_struct *fasync_writers;
struct inode *inode;
struct pipe_buffer bufs[PIPE_BUFFERS]; //緩衝區數組
};
結構中的域bufs就是構成管道的內存緩衝區。該緩衝區用結構pipe_buffer來描述:
struct pipe_buffer {
struct page *page; //緩衝頁的結構
unsigned int offset, len;
const struct pipe_buf_operations *ops; //緩衝區的操作函數集指針
unsigned int flags;
unsigned long private;
};
從上面的數據結構中可以看到,管道實質上就是一個被當做文件來管理的內存緩衝區。
在創建一個管道的i節點時,結構inode中的域i_fop被賦予rdwr_pipefifo_fops,即管道文件本身是既可讀又可寫的。rdwr_pipefifo_fops在文件linux/fs/pipe.c中的定義如下:
const struct file_operations rdwr_pipefifo_fops = {
.llseek = no_llseek,
.read = do_sync_read,
.aio_read = pipe_read,
.write = do_sync_write,
.aio_write = pipe_write,
.poll = pipe_poll,
.unlocked_ioctl = pipe_ioctl,
.open = pipe_rdwr_open,
.release = pipe_rdwr_release,
.fasync = pipe_rdwr_fasync,
};
而爲進程所創建的打開文件描述符fildes[0]和fildes[1]中的i_fop,則被分別賦予了只讀的函數操作集read_pipefifo_fops和只寫的函數操作集write_pipefifo_fops。
read_pipefifo_fops和write_pipefifo_fops這兩個操作函數集在文件linux/fs/pipe.c中分別定義如下:
const struct file_operations read_pipefifo_fops = {
.llseek = no_llseek,
.read = do_sync_read,
.aio_read = pipe_read,
.write = bad_pipe_w,
.poll = pipe_poll,
.unlocked_ioctl = pipe_ioctl,
.open = pipe_read_open,
.release = pipe_read_release,
.fasync = pipe_read_fasync,
};
const struct file_operations write_pipefifo_fops = {
.llseek = no_llseek,
.read = bad_pipe_r,
.write = do_sync_write,
.aio_write = pipe_write,
.poll = pipe_poll,
.unlocked_ioctl = pipe_ioctl,
.open = pipe_write_open,
.release = pipe_write_release,
.fasync = pipe_write_fasync,
};
創建匿名管道的進程與管道之間的關係如下圖所示:
當一個進程調用函數pipe()創建一個管道後,管道的連接方式如下所示:
從圖中可以看到,由於管道的出入口都在同一個進程之中,這種管道沒有多大的用途的。但是當這個進程在創建一個新進程之後,情況就變得大不一樣了。
如果父進程創建一個管道之後,又創建了一個子進程,那麼由於子進程繼承了父進程的文件資源,於是管道在父子進程中的連接情況就變成如下圖一樣的情況了:
在確定管道的傳輸方向之後,在父進程中關閉(close())文件描述符fildes[0],在子進程中關閉(close())文件描述符fildes[1],於是管道的連接情況就變成如下情況的單向傳輸管道:
也可以想象,通過關閉文件描述符的方法,在兩個兄弟進程之間也可以實現通信管道。
創建完管道之後,怎麼利用管道來進行數據的通信呢?
管道使用read()和write()函數,採用字節流的方式,具有流動性,讀數據時,每讀一段數據,則管道內會清除已讀走的數據。
- 讀管道時,若管道爲空,則被堵塞,直至管道另一端write將數據寫入到管道爲止。若寫段已關閉,則返回0;
- 寫管道時,若管道已滿,則被阻塞,直到管道另一端read將管道內數據取走爲止。
用close()函數,在創建管道時,寫端需要關閉fildes[0]描述符,讀端需要關閉fildes[1]描述符。當進程關閉前,每個進程需要將沒有關閉的描述符都進行關閉。
匿名管道具有如下特點:
- 由於這種管道沒有其他同步措施,所以爲了不產生混亂,它只能是半雙工的,即數據只能向一個方向流動。如果需要雙方互相傳遞數據,則需要建立兩個管道;
- 只能在父子進程或兄弟進程這些具有親緣關係的進程之間進行通信;
- 匿名管道對於管道兩端的進程而言,就是一個只存在於內存的特殊文件;
- 一個進程向管道中寫的內容被管道另一端的進程讀取。寫入的內容每次都添加在管道緩衝區的末尾,並且每次都是從緩衝區的頭部讀取數據。
匿名管道的侷限性主要有兩點:一是由於管道建立在內存中,所以它的容量不可能很大;二是管道所傳送的是無格式字節流,這就要求使用管道的雙方實現必須對傳輸的數據格式進行約定。
例子:在父子進程之間利用匿名管道通信。
#include <unist.h>
#include <string.h>
#include <wait.h>
#include <stdio.h>
#define MAX_LINE 80
int main()
{
int testPipe[2], ret;
char buf[MAX_LINE + 1];
const char * testbuf = "主程序發送的數據";
if (pipe(testbuf) == 0) {
if (fork() == 0) {
ret = read(testPipe[0], buf, MAX_LINE);
buf[ret] = 0;
printf("子程序讀到的數據爲:%s", buf);
close(testPipe[0]);
}else {
ret = write(testPipe[1], testbuf, strlen(testbuf));
ret = wait(NULL);
close(testPipe[1]);
}
}
return 0;
}
命名管道
由於匿名管道沒有名稱,因此,它只能在一些具有親緣關係的進程之間進行通信,這使它在應用方面受到極大的限制。
命名管道是在實際文件系統上實現的一種通信機制。由於它是一個與進程沒有“血緣關係”的、真正且獨立的文件,所以它可以在任意進程之間實現通信。由於命名管道不支持諸如lseek()等文件定位操作,嚴格遵守先進先出的原則進行傳輸數據,即對管道的讀總是從開始處返回數據,對它的寫總是把數據添加到末尾,所以這種管道也叫做FIFO文件。
同樣,由於需要由管道自身來保證通信進程間的同步,命名管道也是一個只能單方向訪問的文件,並且數據傳輸方式爲FIFO方式。
也就是說,命名管道提供了一個路徑名與之關聯,以FIFO的文件形式存在於文件系統中,在文件系統中產生一個物理文件,其他進程只要訪問該文件路徑,就能彼此通過管道通信。在讀數據端以只讀方式打開管道文件,在寫數據端以只寫方式打開管道文件。
FIFO文件與普通文件的區別:
- 普通文件無法實現字節流方式管理,而且多進程之間訪問共享資源會造成意想不到的問題;
- FIFO文件採用字節流方式管理,遵循先入先出原則,不涉及共享資源訪問。
操作流程爲:mkfifo -> open -> read(write) -> close ->unlink。