【Linux】Linux的管道

管道是Linux由Unix那裏繼承過來的進程間的通信機制,它是Unix早期的一個重要通信機制。其思想是,在內存中創建一個共享文件,從而使通信雙方利用這個共享文件來傳遞信息。由於這種方式具有單向傳遞數據的特點,所以這個作爲傳遞消息的共享文件就叫做“管道”。

在管道的具體實現中,根據通信所使用的的文件是否具有名稱,有“匿名管道”和“命名管道”。

 

管道與共享內存的區別

乍一看,感覺管道和共享內存並不是區別很大,這裏介紹一下兩者之間的區別:

  • 管道需要在內核和用戶空間進行四次的數據拷貝:由用戶空間的buf中將數據拷貝到內核中 -> 內核將數據拷貝到內存中 -> 內存到內核 -> 內核到用戶空間的buf。而共享內存則只拷貝兩次數據:用戶空間到內存 -> 內存到用戶空間。
  • 管道用循環隊列實現,連續傳送數據可以不限大小。共享內存每次傳遞數據大小是固定的;
  • 共享內存可以隨機訪問被映射文件的任意位置,管道只能順序讀寫;
  • 管道可以獨立完成數據的傳遞和通知機制,共享內存需要藉助其他通訊方式進行消息傳遞。

也就是說,兩者之間最大的區別就是: 共享內存區是最快的可用IPC形式,一旦這樣的內存區映射到共享它的進程的地址空間,這些進程間數據的傳遞,就不再通過執行任何進入內核的系統調用來傳遞彼此的數據,節省了時間。

 

匿名管道

匿名管道是在具有公共祖先的進程之間進行通信的一種方式。

前面在介紹進程的創建時講到,由父進程創建的子進程將會賦值父進程包括文件在內的一些資源。如果父進程創建子進程之前創建了一個文件,那麼這個文件的描述符就會被父進程在隨後所創建的子進程所共享。也就是說,父、子進程可以通過這個文件進行通信。如果通信的雙方一方只能進行讀操作,而另一方只能進行寫操作,那麼這個文件就是一個只能單方向傳送消息的管道,如下圖所示:

進程可以通過調用函數pipe()創建一個管道。函數pipe()的原型如下:

int pipe(int fildes[2]);

與該函數pipe()相對應的系統調用sys_pipe()的原型如下:

asmlinkage int sys_pipe(unsigned long __user * fildes);

從本質上來說,pipe()函數的功能就是創建一個內存文件,但與創建普通文件的函數不同,函數pipe()將在參數fildes中爲進程返回這個文件的兩個文件描述符fildes[0]和fildes[1]。其中,fildes[0]是一個具有“只讀”屬性的文件描述符,fildes[1]是一個具有“只寫”屬性的文件描述符,即進程通過fildes[0]只能進行文件的讀操作,而通過fildes[1]只能進行文件的寫操作。

這樣,就使得這個文件像一段只能單向流通的管道一樣,一頭專門用來輸入數據,另一頭專門用來輸出數據,所以稱爲管道。由於這種文件沒有文件名,不能被非親進程所打開,只能用於親屬進程間的通信,所以這種沒有名稱的文件形成的通信管道叫做“匿名管道”。

顯然,如果父進程創建的這種文件只是用來通信,那麼它感興趣的只是該文件所佔用的內存空間,所以也就沒有必要創建一個正式文件,只需創建一個只存在於內存的臨時文件。從這一點來看,匿名管道與共享內存具有共同點,只不過匿名管道時單向通信,而且這個通信只能在親屬進程間進行。

爲支持匿名管道,內核初始化時由內核函數kernel_mount()安裝了一種特殊的文件系統,在該系統中所創建的都是臨時文件。

由於匿名管道是一個文件,所以它也有i節點,其結構如下:

struct inode
{
        ...
        struct file_operations *i_fop;            //文件操作函數集
        struct pipe_inode_info *i_pipe;           //管道文件指針
        ...
};

可以看到,在i節點的結構中有一個pipe_inode_info類型的指針i_pipe,在普通文件中這個指針的值爲NULL,而在管道文件中這個指針則只想一個叫做管道節點信息結構的pipe_inode_info,以表明這是一個管道文件。pipe_inode_info的結構如下:

struct pipe_inode_info {
	wait_queue_head_t wait;            //等待進程隊列
	unsigned int nrbufs, curbuf;
	struct page *tmp_page;
	unsigned int readers;
	unsigned int writers;
	unsigned int waiting_writers;
	unsigned int r_counter;            //以只讀方式訪問管道的進程計數器
	unsigned int w_counter;            //以只寫方式訪問管道的進程計數器
	struct fasync_struct *fasync_readers;
	struct fasync_struct *fasync_writers;
	struct inode *inode;
	struct pipe_buffer bufs[PIPE_BUFFERS];            //緩衝區數組
};

結構中的域bufs就是構成管道的內存緩衝區。該緩衝區用結構pipe_buffer來描述:

struct pipe_buffer {
	struct page *page;                    //緩衝頁的結構
	unsigned int offset, len;
	const struct pipe_buf_operations *ops;            //緩衝區的操作函數集指針
	unsigned int flags;
	unsigned long private;
};

從上面的數據結構中可以看到,管道實質上就是一個被當做文件來管理的內存緩衝區。

在創建一個管道的i節點時,結構inode中的域i_fop被賦予rdwr_pipefifo_fops,即管道文件本身是既可讀又可寫的。rdwr_pipefifo_fops在文件linux/fs/pipe.c中的定義如下:

const struct file_operations rdwr_pipefifo_fops = {
	.llseek		= no_llseek,
	.read		= do_sync_read,
	.aio_read	= pipe_read,
	.write		= do_sync_write,
	.aio_write	= pipe_write,
	.poll		= pipe_poll,
	.unlocked_ioctl	= pipe_ioctl,
	.open		= pipe_rdwr_open,
	.release	= pipe_rdwr_release,
	.fasync		= pipe_rdwr_fasync,
};

而爲進程所創建的打開文件描述符fildes[0]和fildes[1]中的i_fop,則被分別賦予了只讀的函數操作集read_pipefifo_fops和只寫的函數操作集write_pipefifo_fops。

read_pipefifo_fops和write_pipefifo_fops這兩個操作函數集在文件linux/fs/pipe.c中分別定義如下:

const struct file_operations read_pipefifo_fops = {
	.llseek		= no_llseek,
	.read		= do_sync_read,
	.aio_read	= pipe_read,
	.write		= bad_pipe_w,
	.poll		= pipe_poll,
	.unlocked_ioctl	= pipe_ioctl,
	.open		= pipe_read_open,
	.release	= pipe_read_release,
	.fasync		= pipe_read_fasync,
};

const struct file_operations write_pipefifo_fops = {
	.llseek		= no_llseek,
	.read		= bad_pipe_r,
	.write		= do_sync_write,
	.aio_write	= pipe_write,
	.poll		= pipe_poll,
	.unlocked_ioctl	= pipe_ioctl,
	.open		= pipe_write_open,
	.release	= pipe_write_release,
	.fasync		= pipe_write_fasync,
};

創建匿名管道的進程與管道之間的關係如下圖所示:

當一個進程調用函數pipe()創建一個管道後,管道的連接方式如下所示:

從圖中可以看到,由於管道的出入口都在同一個進程之中,這種管道沒有多大的用途的。但是當這個進程在創建一個新進程之後,情況就變得大不一樣了。

如果父進程創建一個管道之後,又創建了一個子進程,那麼由於子進程繼承了父進程的文件資源,於是管道在父子進程中的連接情況就變成如下圖一樣的情況了:

在確定管道的傳輸方向之後,在父進程中關閉(close())文件描述符fildes[0],在子進程中關閉(close())文件描述符fildes[1],於是管道的連接情況就變成如下情況的單向傳輸管道:

也可以想象,通過關閉文件描述符的方法,在兩個兄弟進程之間也可以實現通信管道。

創建完管道之後,怎麼利用管道來進行數據的通信呢?

管道使用read()和write()函數,採用字節流的方式,具有流動性,讀數據時,每讀一段數據,則管道內會清除已讀走的數據。

  • 讀管道時,若管道爲空,則被堵塞,直至管道另一端write將數據寫入到管道爲止。若寫段已關閉,則返回0;
  • 寫管道時,若管道已滿,則被阻塞,直到管道另一端read將管道內數據取走爲止。

用close()函數,在創建管道時,寫端需要關閉fildes[0]描述符,讀端需要關閉fildes[1]描述符。當進程關閉前,每個進程需要將沒有關閉的描述符都進行關閉。

匿名管道具有如下特點:

  • 由於這種管道沒有其他同步措施,所以爲了不產生混亂,它只能是半雙工的,即數據只能向一個方向流動。如果需要雙方互相傳遞數據,則需要建立兩個管道;
  • 只能在父子進程或兄弟進程這些具有親緣關係的進程之間進行通信;
  • 匿名管道對於管道兩端的進程而言,就是一個只存在於內存的特殊文件;
  • 一個進程向管道中寫的內容被管道另一端的進程讀取。寫入的內容每次都添加在管道緩衝區的末尾,並且每次都是從緩衝區的頭部讀取數據。

匿名管道的侷限性主要有兩點:一是由於管道建立在內存中,所以它的容量不可能很大;二是管道所傳送的是無格式字節流,這就要求使用管道的雙方實現必須對傳輸的數據格式進行約定。

例子:在父子進程之間利用匿名管道通信。

#include <unist.h>
#include <string.h>
#include <wait.h>
#include <stdio.h>

#define MAX_LINE 80

int main()
{
	int testPipe[2], ret;
	char buf[MAX_LINE + 1];
	const char * testbuf = "主程序發送的數據";

	if (pipe(testbuf) == 0) {
		if (fork() == 0) {
			ret = read(testPipe[0], buf, MAX_LINE);
			buf[ret] = 0;
			printf("子程序讀到的數據爲:%s", buf);
			close(testPipe[0]);
		}else {
			ret = write(testPipe[1], testbuf, strlen(testbuf));
			ret = wait(NULL);
			close(testPipe[1]);
		}
	}
	
	return 0;
}

 

命名管道

由於匿名管道沒有名稱,因此,它只能在一些具有親緣關係的進程之間進行通信,這使它在應用方面受到極大的限制。

命名管道是在實際文件系統上實現的一種通信機制。由於它是一個與進程沒有“血緣關係”的、真正且獨立的文件,所以它可以在任意進程之間實現通信。由於命名管道不支持諸如lseek()等文件定位操作,嚴格遵守先進先出的原則進行傳輸數據,即對管道的讀總是從開始處返回數據,對它的寫總是把數據添加到末尾,所以這種管道也叫做FIFO文件。

同樣,由於需要由管道自身來保證通信進程間的同步,命名管道也是一個只能單方向訪問的文件,並且數據傳輸方式爲FIFO方式。

也就是說,命名管道提供了一個路徑名與之關聯,以FIFO的文件形式存在於文件系統中,在文件系統中產生一個物理文件,其他進程只要訪問該文件路徑,就能彼此通過管道通信。在讀數據端以只讀方式打開管道文件,在寫數據端以只寫方式打開管道文件。

FIFO文件與普通文件的區別:

  • 普通文件無法實現字節流方式管理,而且多進程之間訪問共享資源會造成意想不到的問題;
  • FIFO文件採用字節流方式管理,遵循先入先出原則,不涉及共享資源訪問。

操作流程爲:mkfifo -> open -> read(write) -> close ->unlink。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章