操作系統IO操作模式

一、關鍵概念理解
同步：發起一個調用，得到結果才返回。
異步：調用發起後，調用直接返回；調用方主動詢問被調用方獲取結果，或被調用方通過回調函數。
阻塞：調用是指調用結果返回之前，當前線程會被掛起。調用線程只有在得到結果之後纔會返回。
非阻塞：調用指在不能立刻得到結果之前，該調用不會阻塞當前線程。
同步纔有阻塞和非阻塞之分；

阻塞與非阻塞關乎如何對待事情產生的結果（阻塞：不等到想要的結果我就不走了）

二、進程的狀態轉換
就緒狀態 -> 運行狀態：處於就緒狀態的進程被調度後，獲得CPU資源（分派CPU時間片），於是進程由就緒狀態轉換爲運行狀態。
運行狀態 -> 就緒狀態：處於運行狀態的進程在時間片用完後，不得不讓出CPU，從而進程由運行狀態轉換爲就緒狀態。此外，在可剝奪的操作系統中，當有更高優先級的進程就、緒時，調度程度將正執行的進程轉換爲就緒狀態，讓更高優先級的進程執行。
運行狀態 -> 阻塞狀態：當進程請求某一資源（如外設）的使用和分配或等待某一事件的發生（如I/O操作的完成）時，它就從運行狀態轉換爲阻塞狀態。進程以系統調用的形式請求操作系統提供服務，這是一種特殊的、由運行用戶態程序調用操作系統內核過程的形式。

阻塞狀態 -> 就緒狀態：當進程等待的事件到來時，如I/O操作結束或中斷結束時，中斷處理程序必須把相應進程的狀態由阻塞狀態轉換爲就緒狀態。

三、操作系統IO模型

1、同步阻塞IO

同步阻塞IO模型是最簡單的IO模型，用戶線程在內核進行IO操作時被阻塞。

如圖1所示，用戶線程通過系統調用read發起IO讀操作，由用戶空間轉到內核空間。內核等到數據包到達後，然後將接收的數據拷貝到用戶空間，完成read操作。

用戶線程使用同步阻塞IO模型的僞代碼描述爲：

{
read(socket, buffer);
process(buffer);
}

即用戶需要等待read將socket中的數據讀取到buffer後，才繼續處理接收的數據。整個IO請求的過程中，用戶線程是被阻塞的，這導致用戶在發起IO請求時，不能做任何事情，對CPU的資源利用率不夠。

2、同步非阻塞IO

同步非阻塞IO是在同步阻塞IO的基礎上，將socket設置爲NONBLOCK。這樣做用戶線程可以在發起IO請求後可以立即返回。

如圖2所示，由於socket是非阻塞的方式，因此用戶線程發起IO請求時立即返回。但並未讀取到任何數據，用戶線程需要不斷地發起IO請求，直到數據到達後，才真正讀取到數據，繼續執行。

用戶線程使用同步非阻塞IO模型的僞代碼描述爲：

{
while(read(socket, buffer) != SUCCESS)
;
process(buffer);
}

即用戶需要不斷地調用read，嘗試讀取socket中的數據，直到讀取成功後，才繼續處理接收的數據。整個IO請求的過程中，雖然用戶線程每次發起IO請求後可以立即返回，但是爲了等到數據，仍需要不斷地輪詢、重複請求，消耗了大量的CPU的資源。一般很少直接使用這種模型，而是在其他IO模型中使用非阻塞IO這一特性。

3、IO多路複用

IO多路複用模型是建立在內核提供的多路分離函數select基礎之上的，使用select函數可以避免同步非阻塞IO模型中輪詢等待的問題。

如圖3所示，用戶首先將需要進行IO操作的socket添加到select中，然後阻塞等待select系統調用返回。當數據到達時，socket被激活，select函數返回。用戶線程正式發起read請求，讀取數據並繼續執行。
從流程上來看，使用select函數進行IO請求和同步阻塞模型沒有太大的區別，甚至還多了添加監視socket，以及調用select函數的額外操作，效率更差。但是，使用select以後最大的優勢是用戶可以在一個線程內同時處理多個socket的IO請求。用戶可以註冊多個socket，然後不斷地調用select讀取被激活的socket，即可達到在同一個線程內同時處理多個IO請求的目的。而在同步阻塞模型中，必須通過多線程的方式才能達到這個目的。

用戶線程使用select函數的僞代碼描述爲：

{
    select(socket);
    while(1) {
        sockets = select();
        for(socket in sockets) {
            if(can_read(socket)) {
            read(socket, buffer);
            process(buffer);
            }
        }
    }
}

其中while循環前將socket添加到select監視中，然後在while內一直調用select獲取被激活的socket，一旦socket可讀，便調用read函數將socket中的數據讀取出來。

然而，使用select函數的優點並不僅限於此。雖然上述方式允許單線程內處理多個IO請求，但是每個IO請求的過程還是阻塞的（在select函數上阻塞），平均時間甚至比同步阻塞IO模型還要長。如果用戶線程只註冊自己感興趣的socket或者IO請求，然後去做自己的事情，等到數據到來時再進行處理，則可以提高CPU的利用率。

4、異步IO

“真正”的異步IO需要操作系統更強的支持。在IO多路複用模型中，事件循環將文件句柄的狀態事件通知給用戶線程，由用戶線程自行讀取數據、處理數據。而在異步IO模型中，當用戶線程收到通知時，數據已經被內核讀取完畢，並放在了用戶線程指定的緩衝區內，內核在IO完成後通知用戶線程直接使用即可。

如圖7所示，異步IO模型中，用戶線程直接使用內核提供的異步IO API發起read請求，且發起後立即返回，繼續執行用戶線程代碼。不過此時用戶線程已經將調用的AsynchronousOperation和CompletionHandler註冊到內核，然後操作系統開啓獨立的內核線程去處理IO操作。當read請求的數據到達時，由內核負責讀取socket中的數據，並寫入用戶指定的緩衝區中。最後內核將read的數據和用戶線程註冊的CompletionHandler分發給內部Proactor，Proactor將IO完成的信息通知給用戶線程（一般通過調用用戶線程註冊的完成事件處理函數），完成異步IO。

用戶線程使用異步IO模型的僞代碼描述爲：

void UserCompletionHandler::handle_event(buffer) {
process(buffer);
}
{
aio_read(socket, new UserCompletionHandler);
}

用戶需要重寫CompletionHandler的handle_event函數進行處理數據的工作，參數buffer表示Proactor已經準備好的數據，用戶線程直接調用內核提供的異步IO API，並將重寫的CompletionHandler註冊即可。

相比於IO多路複用模型，異步IO並不十分常用，不少高性能併發服務程序使用IO多路複用模型+多線程任務處理的架構基本可以滿足需求。況且目前操作系統對異步IO的支持並非特別完善，更多的是採用IO多路複用模型模擬異步IO的方式（IO事件觸發時不直接通知用戶線程，而是將數據讀寫完畢後放到用戶指定的緩衝區中）。

總結

操作系統IO操作模式

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

Python 引用傳遞問題

leetcode-100 相同的樹

leetcode-20 有效的括號

PYQT5設計思路

Python ElementTree findall函數Bug

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結