unix下標準IO和文件IO區別與聯繫

一、什麼是文件I/O和標準I/O:

文件I/O:文件I/O稱之爲不帶緩存的IO(unbuffered I/O)。不帶緩存指的是每個read,write都調用內核中的一個系統調用。也就是一般所說的低級I/O——操作系統提供的基本IO服務,與os綁定,特定於linix或unix平臺。

標準I/O:標準I/O是ANSI C建立的一個標準I/O模型,是一個標準函數包和stdio.h頭文件中的定義,具有一定的可移植性。標準I/O庫處理很多細節。例如緩存分配,以優化長度執行I/O等。標準的I/O提供了三種類型的緩存。

(1)全緩存:當填滿標準I/O緩存後才進行實際的I/O操作。
(2)行緩存:當輸入或輸出中遇到新行符時,標準I/O庫執行I/O操作。
(3)不帶緩存:stderr就是了。

二、二者的區別

文件I/O 又稱爲低級磁盤I/O,遵循POSIX相關標準。任何兼容POSIX標準的操作系統上都支持文件I/O。標準I/O被稱爲高級磁盤I/O,遵循ANSI C相關標準。只要開發環境中有標準I/O庫,標準I/O就可以使用。(Linux 中使用的是GLIBC,它是標準C庫的超集。不僅包含ANSI C中定義的函數,還包括POSIX標準中定義的函數。因此,Linux 下既可以使用標準I/O,也可以使用文件I/O)。

通過文件I/O讀寫文件時,每次操作都會執行相關係統調用。這樣處理的好處是直接讀寫實際文件,壞處是頻繁的系統調用會增加系統開銷,標準I/O可以看成是在文件I/O的基礎上封裝了緩衝機制。先讀寫緩衝區,必要時再訪問實際文件,從而減少了系統調用的次數。

文件I/O中用文件描述符表現一個打開的文件,可以訪問不同類型的文件如普通文件、設備文件和管道文件等。而標準I/O中用FILE(流)表示一個打開的文件,通常只用來訪問普通文件。

三、相應的函數

在這裏插入圖片描述

1.fopen與open

標準I/O使用fopen函數打開一個文件:

FILE* fp=fopen(const char* path,const char *mod)

其中path是文件名,mod用於指定文件打開的模式的字符串,比如 "r","w","w+","a"等等,可以加上字母b用以指定以二進制模式打開(對於 *nix系統,只有一種文件類型,因此沒有區別),如果成功打開,返回一個FILE文件指針,如果失敗返回NULL,這裏的文件指針並不是指向實際的文 件,而是一個關於文件信息的數據包,其中包括文件使用的緩衝區信息。

文件IO使用open函數用於打開一個文件:

int fd=open(char *name,int how);

與fopen類似,name表示文件名字符串,而how指定打開的模式:O_RDONLY(只讀),O_WRONLY(只寫),O_RDWR (可讀可寫),還有其他模式請man 2 open。成功返回一個正整數稱爲文件描述符,這與標準I/O顯著不同,失敗的話返回-1,與標準I/O返回NULL也是不同的。

2.fclose與close

與打開文件相對的,標準I/O使用fclose關閉文件,將文件指針傳入即可,如果成功關閉,返回0,否則返回EOF
比如:

if(fclose(fp)!=0)  
	printf("Error in closing file");

而文件IO使用close用於關閉open打開的文件,與fclose類似,只不過當錯誤發生時返回的是-1,而不是EOF,成功關閉同樣是返回0。C語言用error code來進行錯誤處理的傳統做法。

3. 讀文件,getc,fscanf,fgets和read

標 準I/O中進行文件讀取可以使用getc,一個字符一個字符的讀取,也可以使用gets(讀取標準io讀入的)、fgets以字符串單位進行讀取(讀到遇 到的第一個換行字符的後面),gets(接受一個參數,文件指針)不判斷目標數組是否能夠容納讀入的字符,可能導致存儲溢出(不建議使用),而fgets使用三個參數:
char * fgets(char *s, int size, FILE *stream);

第一個參數和gets一樣,用於存儲輸入的地址,第二個參數爲整數,表示輸入字符串的最大長度,最後一個參數就是文件指針,指向要讀取的文件。最 後是fscanf,與scanf類似,只不過增加了一個參數用於指定操作的文件,比如fscanf(fp,"%s",words)
文件IO中使用read函數用於讀取open函數打開的文件,函數原型如下:

ssize_t numread=read(int fd,void *buf,size_t qty);

其中fd就是open返回的文件描述符,buf用於存儲數據的目的緩衝區,而qty指定要讀取的字節數。如果成功讀取,就返回讀取的字節數目(小於等於qty)

4. 判斷文件結尾

如果嘗試讀取達到文件結尾,標準IO的getc會返回特殊值EOF,而fgets碰到EOF會返回NULL,而對於*nix的read函數,情況有所不 同。read讀取qty指定的字節數,最終讀取的數據可能沒有你所要求的那麼多(qty),而當讀到結尾再要讀的話,read函數將返回0.

5. 寫文件:putc,fputs,fprintf和write

與讀文件相對應的,標準C語言I/O使用putc寫入字符,比如:

putc(ch,fp);

第一個參數是字符,第二個是文件指針。而fputs與此類似:

fputs(buf,fp);

僅僅是第一個參數換成了字符串地址。而fprintf與printf類似,增加了一個參數用於指定寫入的文件,比如:

fprintf(stdout,"Hello %s.\n","dennis");

切記fscanf和fprintf將FILE指針作爲第一個參數,而putc,fputs則是作爲第二個參數。

在文件IO中提供write函數用於寫入文件,原型與read類似:

ssize_t result=write(int fd,void *buf ,size_t amt);

fd是文件描述符,buf是將要寫入的內存數據,amt是要寫的字節數。如果寫入成功返回寫入的字節數,通過result與amt的比較可以判斷是否寫入正常,如果寫入失敗返回-1

6. 隨機存取:fseek()、ftell()和lseek()

標準I/O使用fseek和ftell用於文件的隨機存取,先看看fseek函數原型

int fseek(FILE *stream, long offset, int whence);

第一個參數是文件指針,第二個參數是一個long類型的偏移量(offset),表示從起始點開始移動的距離。第三個參數就是用於指定起始點的模式,stdio.h指定了下列模式常量:

SEEK_SET            文件開始處 
SEEK_CUR            當前位置 
SEEK_END            文件結尾處

看幾個調用例子:

 fseek(fp,0L,SEEK_SET); //找到文件的開始處 
 fseek(fp,0L,SEEK_END); //定位到文件結尾處 
 fseek(fp,2L,SEEK_CUR); //文件當前位置向前移動2個字節數

而ftell函數用於返回文件的當前位置,返回類型是一個long類型,比如下面的調用:

fseek(fp,0L,SEEK_END);//定位到結尾 
        long last=ftell(fp); //返回當前位置

那麼此時的last就是文件指針fp指向的文件的字節數。

與標準I/O類似,*nix系統提供了lseek來完成fseek的功能,原型如下:

off_t lseek(int fildes, off_t offset, int whence);

fildes是文件描述符,而offset也是偏移量,whence同樣是指定起始點模式,唯一的不同是lseek有返回值,如果成功就 返回指針變化前的位置,否則返回-1。whence的取值與fseek相同:SEEK_SET,SEEK_CUR,SEEK_END,但也可以用整數 0,1,2相應代替。

四、系統調用與庫函數

上面我們一直在討論文件I/O與標準I/O的區別,其實可以這樣說,文件I/O是系統調用、標準I/O是庫函數,看下面這張圖:

在這裏插入圖片描述

POSIX:Portable Operating System Interface 可移植操作系統接口

ANSI:American National Standrads Institute 美國國家標準學會

1、系統調用

操作系統負責管理和分配所有的計算機資源。爲了更好地服務於應用程序,操作系統提供了一組特殊接口——系統調用。通過這組接口用戶程序可以使用操作系統內核提供的各種功能。例如分配內存、創建進程、實現進程之間的通信等。

爲什麼不允許程序直接訪問計算機資源?答案是不安全。單片機開發中,由於不需要操作系統,所以開發人員可以編寫代碼直接訪問硬件。而在32位嵌入式系統中通常都要運行操作系統,所以開發人員可以編寫代碼直接訪問硬件。而在32位嵌入式系統中通常都要運行操作系統,程序訪問資源的方式都發生了改變。操作系統基本上都支持多任務,即同時可以運行多個程序。如果允許程序直接訪問系統資源,肯定會帶來很多問題。因此,所有軟硬件資源的管理和分配都有操作系統負責。程序要獲取資源(如分配內存,讀寫串口)必須由操作系統來完成,即用戶程序向操作系統發出服務請求,操作系統收到請求後執行相關的代碼來處理。

用戶程序向操作系統提出請求的接口就是系統調用。所有的操作系統都會提供系統調用接口,只不過不同的操作系統提供的系統調用接口各不相同。Linux 系統調用接口非常精簡,它繼承了Unix 系統調用中最基本的和最有用的部分。這些系統調用按照功能大致可分爲進程控制、進程間通信、文件系統控制、存儲管理、網絡管理、套接字控制、用戶管理等幾類。

2、庫函數

庫函數可以說是對系統調用的一種封裝,因爲系統調用是面對的是操作系統,系統包括Linux、Windows等,如果直接系統調用,會影響程序的移植性,所以這裏使用了庫函數,比如說C庫,這樣只要系統中安裝了C庫,就都可以使用這些函數,比如printf() scanf()等,C庫相當於對系統函數進行了翻譯,使我們的APP可以調用這些函數;

3、用戶編程接口API

前面提到利用系統調用接口程序可以訪問各種資源,但在實際開發中程序並不直接使用系統調用接口,而是使用用戶編程接口(API)。爲什麼不直接使用系統調用接口呢?

原因如下:

  • 系統調用接口功能非常簡單,無法滿足程序的需求。

  • 不同操作系統的系統調用接口不兼容,程序移植時工作量大。

用戶編程接口通俗的解釋就是各種庫(最重要的就是C庫)中的函數。爲了提高開發效率,C庫中實現了很多函數。這些函數實現了常用的功能,供程序員調用。這樣一來,程序員不需要自己編寫這些代碼,直接調用庫函數就可以實現基本功能,提高了代碼的複用率。使用用戶編程接口還有一個好處:程序具有良好的可移植性。幾乎所有的操作系統上都實現了C庫,所以程序通常只需要重新編譯一下就可以在其他操作系統下運行。

用戶編程接口(API)在實現時,通常都要依賴系統調用接口。例如,創建進程的API函數fork()對應於內核空間的sys_fork()系統調用。很多API函數西亞我哦通過多個系統調用來完成其功能。還有一些API函數不要調用任何系統調用。

在Linux 中用戶編程接口(API)遵循了在Unix中最流行的應用編程界面標準——POSIX標準。POSIX標準是由IEEE和ISO/IEC共同開發的標準系統。該標準基於當時想用的Unix 實踐和經驗,描述了操作系統的系統調用編程接口(實際上就是API),用於保證應用程序可以在源代碼一級商多種操作系統上運行。這些系統調用編程接口主要是通過C庫(libc )實現的。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章