【Linux】Linux的管道

管道是Linux由Unix那裏繼承過來的進程間的通信機制，它是Unix早期的一個重要通信機制。其思想是，在內存中創建一個共享文件，從而使通信雙方利用這個共享文件來傳遞信息。由於這種方式具有單向傳遞數據的特點，所以這個作爲傳遞消息的共享文件就叫做“管道”。

在管道的具體實現中，根據通信所使用的的文件是否具有名稱，有“匿名管道”和“命名管道”。

管道與共享內存的區別

乍一看，感覺管道和共享內存並不是區別很大，這裏介紹一下兩者之間的區別：

管道需要在內核和用戶空間進行四次的數據拷貝：由用戶空間的buf中將數據拷貝到內核中 -> 內核將數據拷貝到內存中 -> 內存到內核 -> 內核到用戶空間的buf。而共享內存則只拷貝兩次數據：用戶空間到內存 -> 內存到用戶空間。
管道用循環隊列實現，連續傳送數據可以不限大小。共享內存每次傳遞數據大小是固定的；
共享內存可以隨機訪問被映射文件的任意位置，管道只能順序讀寫；
管道可以獨立完成數據的傳遞和通知機制，共享內存需要藉助其他通訊方式進行消息傳遞。

也就是說，兩者之間最大的區別就是：共享內存區是最快的可用IPC形式，一旦這樣的內存區映射到共享它的進程的地址空間，這些進程間數據的傳遞，就不再通過執行任何進入內核的系統調用來傳遞彼此的數據，節省了時間。

匿名管道

匿名管道是在具有公共祖先的進程之間進行通信的一種方式。

前面在介紹進程的創建時講到，由父進程創建的子進程將會賦值父進程包括文件在內的一些資源。如果父進程創建子進程之前創建了一個文件，那麼這個文件的描述符就會被父進程在隨後所創建的子進程所共享。也就是說，父、子進程可以通過這個文件進行通信。如果通信的雙方一方只能進行讀操作，而另一方只能進行寫操作，那麼這個文件就是一個只能單方向傳送消息的管道，如下圖所示：

進程可以通過調用函數pipe()創建一個管道。函數pipe()的原型如下：

int pipe(int fildes[2]);

與該函數pipe()相對應的系統調用sys_pipe()的原型如下：

asmlinkage int sys_pipe(unsigned long __user * fildes);

從本質上來說，pipe()函數的功能就是創建一個內存文件，但與創建普通文件的函數不同，函數pipe()將在參數fildes中爲進程返回這個文件的兩個文件描述符fildes[0]和fildes[1]。其中，fildes[0]是一個具有“只讀”屬性的文件描述符，fildes[1]是一個具有“只寫”屬性的文件描述符，即進程通過fildes[0]只能進行文件的讀操作，而通過fildes[1]只能進行文件的寫操作。

這樣，就使得這個文件像一段只能單向流通的管道一樣，一頭專門用來輸入數據，另一頭專門用來輸出數據，所以稱爲管道。由於這種文件沒有文件名，不能被非親進程所打開，只能用於親屬進程間的通信，所以這種沒有名稱的文件形成的通信管道叫做“匿名管道”。

顯然，如果父進程創建的這種文件只是用來通信，那麼它感興趣的只是該文件所佔用的內存空間，所以也就沒有必要創建一個正式文件，只需創建一個只存在於內存的臨時文件。從這一點來看，匿名管道與共享內存具有共同點，只不過匿名管道時單向通信，而且這個通信只能在親屬進程間進行。

爲支持匿名管道，內核初始化時由內核函數kernel_mount()安裝了一種特殊的文件系統，在該系統中所創建的都是臨時文件。

由於匿名管道是一個文件，所以它也有i節點，其結構如下：

struct inode
{
        ...
        struct file_operations *i_fop;            //文件操作函數集
        struct pipe_inode_info *i_pipe;           //管道文件指針
        ...
};

可以看到，在i節點的結構中有一個pipe_inode_info類型的指針i_pipe，在普通文件中這個指針的值爲NULL，而在管道文件中這個指針則只想一個叫做管道節點信息結構的pipe_inode_info，以表明這是一個管道文件。pipe_inode_info的結構如下：

struct pipe_inode_info {
	wait_queue_head_t wait;            //等待進程隊列
	unsigned int nrbufs, curbuf;
	struct page *tmp_page;
	unsigned int readers;
	unsigned int writers;
	unsigned int waiting_writers;
	unsigned int r_counter;            //以只讀方式訪問管道的進程計數器
	unsigned int w_counter;            //以只寫方式訪問管道的進程計數器
	struct fasync_struct *fasync_readers;
	struct fasync_struct *fasync_writers;
	struct inode *inode;
	struct pipe_buffer bufs[PIPE_BUFFERS];            //緩衝區數組
};

結構中的域bufs就是構成管道的內存緩衝區。該緩衝區用結構pipe_buffer來描述：

struct pipe_buffer {
	struct page *page;                    //緩衝頁的結構
	unsigned int offset, len;
	const struct pipe_buf_operations *ops;            //緩衝區的操作函數集指針
	unsigned int flags;
	unsigned long private;
};

從上面的數據結構中可以看到，管道實質上就是一個被當做文件來管理的內存緩衝區。

在創建一個管道的i節點時，結構inode中的域i_fop被賦予rdwr_pipefifo_fops，即管道文件本身是既可讀又可寫的。rdwr_pipefifo_fops在文件linux/fs/pipe.c中的定義如下：

const struct file_operations rdwr_pipefifo_fops = {
	.llseek		= no_llseek,
	.read		= do_sync_read,
	.aio_read	= pipe_read,
	.write		= do_sync_write,
	.aio_write	= pipe_write,
	.poll		= pipe_poll,
	.unlocked_ioctl	= pipe_ioctl,
	.open		= pipe_rdwr_open,
	.release	= pipe_rdwr_release,
	.fasync		= pipe_rdwr_fasync,
};

而爲進程所創建的打開文件描述符fildes[0]和fildes[1]中的i_fop，則被分別賦予了只讀的函數操作集read_pipefifo_fops和只寫的函數操作集write_pipefifo_fops。

read_pipefifo_fops和write_pipefifo_fops這兩個操作函數集在文件linux/fs/pipe.c中分別定義如下：

const struct file_operations read_pipefifo_fops = {
	.llseek		= no_llseek,
	.read		= do_sync_read,
	.aio_read	= pipe_read,
	.write		= bad_pipe_w,
	.poll		= pipe_poll,
	.unlocked_ioctl	= pipe_ioctl,
	.open		= pipe_read_open,
	.release	= pipe_read_release,
	.fasync		= pipe_read_fasync,
};

const struct file_operations write_pipefifo_fops = {
	.llseek		= no_llseek,
	.read		= bad_pipe_r,
	.write		= do_sync_write,
	.aio_write	= pipe_write,
	.poll		= pipe_poll,
	.unlocked_ioctl	= pipe_ioctl,
	.open		= pipe_write_open,
	.release	= pipe_write_release,
	.fasync		= pipe_write_fasync,
};

創建匿名管道的進程與管道之間的關係如下圖所示：

當一個進程調用函數pipe()創建一個管道後，管道的連接方式如下所示：

從圖中可以看到，由於管道的出入口都在同一個進程之中，這種管道沒有多大的用途的。但是當這個進程在創建一個新進程之後，情況就變得大不一樣了。

如果父進程創建一個管道之後，又創建了一個子進程，那麼由於子進程繼承了父進程的文件資源，於是管道在父子進程中的連接情況就變成如下圖一樣的情況了：

在確定管道的傳輸方向之後，在父進程中關閉（close()）文件描述符fildes[0]，在子進程中關閉（close()）文件描述符fildes[1]，於是管道的連接情況就變成如下情況的單向傳輸管道：

也可以想象，通過關閉文件描述符的方法，在兩個兄弟進程之間也可以實現通信管道。

創建完管道之後，怎麼利用管道來進行數據的通信呢？

管道使用read()和write()函數，採用字節流的方式，具有流動性，讀數據時，每讀一段數據，則管道內會清除已讀走的數據。

讀管道時，若管道爲空，則被堵塞，直至管道另一端write將數據寫入到管道爲止。若寫段已關閉，則返回0；
寫管道時，若管道已滿，則被阻塞，直到管道另一端read將管道內數據取走爲止。

用close()函數，在創建管道時，寫端需要關閉fildes[0]描述符，讀端需要關閉fildes[1]描述符。當進程關閉前，每個進程需要將沒有關閉的描述符都進行關閉。

匿名管道具有如下特點：

由於這種管道沒有其他同步措施，所以爲了不產生混亂，它只能是半雙工的，即數據只能向一個方向流動。如果需要雙方互相傳遞數據，則需要建立兩個管道；
只能在父子進程或兄弟進程這些具有親緣關係的進程之間進行通信；
匿名管道對於管道兩端的進程而言，就是一個只存在於內存的特殊文件；
一個進程向管道中寫的內容被管道另一端的進程讀取。寫入的內容每次都添加在管道緩衝區的末尾，並且每次都是從緩衝區的頭部讀取數據。

匿名管道的侷限性主要有兩點：一是由於管道建立在內存中，所以它的容量不可能很大；二是管道所傳送的是無格式字節流，這就要求使用管道的雙方實現必須對傳輸的數據格式進行約定。

例子：在父子進程之間利用匿名管道通信。

#include <unist.h>
#include <string.h>
#include <wait.h>
#include <stdio.h>

#define MAX_LINE 80

int main()
{
	int testPipe[2], ret;
	char buf[MAX_LINE + 1];
	const char * testbuf = "主程序發送的數據";

	if (pipe(testbuf) == 0) {
		if (fork() == 0) {
			ret = read(testPipe[0], buf, MAX_LINE);
			buf[ret] = 0;
			printf("子程序讀到的數據爲：%s", buf);
			close(testPipe[0]);
		}else {
			ret = write(testPipe[1], testbuf, strlen(testbuf));
			ret = wait(NULL);
			close(testPipe[1]);
		}
	}
	
	return 0;
}

命名管道

由於匿名管道沒有名稱，因此，它只能在一些具有親緣關係的進程之間進行通信，這使它在應用方面受到極大的限制。

命名管道是在實際文件系統上實現的一種通信機制。由於它是一個與進程沒有“血緣關係”的、真正且獨立的文件，所以它可以在任意進程之間實現通信。由於命名管道不支持諸如lseek()等文件定位操作，嚴格遵守先進先出的原則進行傳輸數據，即對管道的讀總是從開始處返回數據，對它的寫總是把數據添加到末尾，所以這種管道也叫做FIFO文件。

同樣，由於需要由管道自身來保證通信進程間的同步，命名管道也是一個只能單方向訪問的文件，並且數據傳輸方式爲FIFO方式。

也就是說，命名管道提供了一個路徑名與之關聯，以FIFO的文件形式存在於文件系統中，在文件系統中產生一個物理文件，其他進程只要訪問該文件路徑，就能彼此通過管道通信。在讀數據端以只讀方式打開管道文件，在寫數據端以只寫方式打開管道文件。

FIFO文件與普通文件的區別：

普通文件無法實現字節流方式管理，而且多進程之間訪問共享資源會造成意想不到的問題；
FIFO文件採用字節流方式管理，遵循先入先出原則，不涉及共享資源訪問。

操作流程爲：mkfifo -> open -> read（write） -> close ->unlink。

【Linux】Linux的管道

管道與共享內存的區別

匿名管道

命名管道

這種嵌套字典類型的數據，我想把它讀取到df裏，如何操作？

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺

iNeuOS工業互聯網操作系統，增加電力IEC104協議

微服務實踐k8s&dapr開發部署實驗（3）訂閱發佈

【CMake】CMakeLists.txt的超傻瓜手把手教程（附實例源碼）

【GDB】手把手教你用gdb調試程序（超清晰流程）

【C++】C++字符串和數字的拼接

【C++】C++11的std::array的詳細剖析

【OpenCV】OpenCV常用函數（C++版）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結