unix解釋器原理

轉自: http://www.cnblogs.com/hbt19860104/archive/2008/07/24/1250898.html

引言
使用Shell進行工作的人們對Unix/Linux下的Shell編程都很熟悉，在所有的Shell編程的書中都會提到#!/bin/bash,而這裏到底包含了些什麼？對操作系統而言，這一行字符串意味着什麼？你可能會說，不就是會讓 /bin/bash程序來解釋這個腳本程序嗎？當然你是對的，看看我們的標題，這裏我們談談解釋器，讓我們一起來看看腳本文件裏的第一句到底對系統而言意味着什麼。但有一點我們可先明確一下，所謂解釋器就是指#!行後面的可執行的程序。

一、我們從exec族函數談起
如果你從不寫C程序，可能需要對本節的內容看得更爲仔細並且試驗一下。

代碼:

#include <unistd.h> extern char **environ; int execl(const char *path, const char *arg, ...); int execlp(const char *file, const char *arg, ...); int execle(const char *path, const char *arg , ..., char * const envp[]); int execv(const char *path, char *const argv[]); int execvp(const char *file, char *const argv[]); int execve(const char *pathname, char *const argv[], char *const envp []);

exec 族函數一共有上面所列的5個(seawolf1979注：其實應該是6個，還包括execve，見上方紅色標出部分)，作用都是一樣：執行一段新的代碼。區別只是向函數傳遞的參數方式不同而已，我在這裏講講execl函數：第一個參數 path是指向設置了執行位文件的路徑，後面的可變參數列表分別指向了傳遞給此執行文件的參數列表(包括了參數0,即是執行文件的名稱)。最後一個參數爲 (char *) 0，表示參數列表結束。

對於解釋器，exec族函數是這樣做的(以execl爲例)，如果path是指向了一個腳本，腳本的第一行以#!開頭，則這樣調用：
以#!後面的字符串爲命令，後面加上execl參數列表中指定的參數列表，這樣形成了新的程序執行。
下面我們以例子來驗證這個結果：

下面這個C程序的作用是回射所有命令行參數。

代碼:

/* Program source : showargs.c * * Program name : showargs */ #include <unistd.h> int main(int argc, char *argv[]) { int i; for(i = 0; i < argc; i++) { printf("arg[%d]: %s/n", i, argv[i]); } return 0; }

編譯：gcc -o showargs showargs.c
執行：

代碼:

$ pwd /home/kiron $ ./showargs arg1 arg2 arg[0]: ./showargs arg[1]: arg1 arg[2]: arg2

我們在同一個目錄下再寫一個腳本：

代碼:

#!/home/kiron/showargs addargs

我沒有打錯，是的，這個腳本就只有一行，這個腳本我們命名爲testexec，加上執行位後，執行情況如下：

代碼:

$ ./testexec arg[0]: /home/kiron/showargs arg[1]: addargs arg[2]: ./testexec

怎麼會這樣？我猜會有人對第2個參數./testexec不理解，暫且賣個關子，再引出一個C程序：

代碼:

/* Program source : mytest.c * * Program name : mytest */ #include <stdio.h> int main(void) { execl("/home/kiron/testexec", "testexec", "arg1", "arg2", (char *) 0); return 0; }

編譯：gcc -o mytest mytest.c
執行：

代碼:

$ ./mytest arg[0]: /home/kiron/showargs arg[1]: addargs arg[2]: /home/kiron/testexec arg[3]: arg1 arg[4]: arg2

仔細觀察上面的三個例子，答案開始浮出水面了。正如在開始時講到的，exec族函數的處理是把#!後面的字符串爲命令，後面加上execl參數列表中指定的參數列表，這樣形成了新的程序執行。分析一下mytest.c源程序，execl把命令的結果是這樣執行的/home/kiron/testexec的內容是#!/home/kiron/showargs addargs，則#!後面的字符串"/home/kiron/showargs addargs"加上命令參數列表："/home/kiron/testexec arg1 arg2"就形成了新的程序行：/home/kiron/showargs addargs /home/kiron/testexec arg1 arg2。對於testexec腳本，我們在shell中調用它時，shell調用了fork,exec,wait來執行它，也就是和程序 mytest.c一樣用了exec函數，首先，exec函數對#!行分析後得出此腳本的解釋器爲/home/kiron/showargs，然後就形成了把命令行處理成了：“/home/kiron/showargs addargs ./testexec”。

注意：#!行中的解釋器的路徑必須是全路徑，exec函數並不對其特殊處理，比如用PATH變量來搜索它的真實路徑，所以路徑是由程序員來保證正確的。

二、我的腳本第一句必須得是#!/bin/bash嗎？
當然不必了，通過上面的解釋，其實第一句的#!是對腳本的解釋器程序路徑，腳本的內容是由解釋器解釋的，我們可以用各種各樣的解釋器來寫對應的腳本，比如說 /bin/csh腳本，/bin/perl腳本，/bin/awk腳本，/bin/sed腳本，甚至/bin/echo等等。那我們真的能寫一個 /bin/echo的腳本文件嗎？我們來試試，下面是一個例子：

代碼:

#!/bin/echo -e

我把這隻有一行的程序(實際上它也只能是一行，echo程序並不是被設計成像awk那樣的編程語言，能寫成源程序文件)命名爲myecho，加上權限後執行它：

代碼:

$ ./myecho "hi/a" ./myecho hi

如果你的echo支持-e選項並且你工作的環境還算安靜，你在得到上面的結果的時候也應該聽到清脆的終端響鈴。但這種程序是毫無作用的。

三、我能利用解釋器來做什麼？
但是上面的echo腳本實際應用時並沒有什麼作用，我們可以得出一個小小的實驗結果，並不是所有的可執行二進制文件都可以用來寫解釋器腳本。那我編寫解釋器的腳本有什麼用？如果你有一個可編程的解釋器，那你或許能編寫該解釋器的程序來簡化你工作。比如說常用到的解釋器如awk,perl,bash等等。但是正如我們上面總結的實驗結果，很不幸地，並不是全部的可編程程序都是有用的解釋器，exec腳本時，能從第一行得到腳本的解釋器，然後用exec去解釋腳本(可能是選項去控制，如#!/bin/awk -f)，也包括了形如#!/PATH/的第一行，如果該解釋器對這行不能忽略的話，就會出錯，另外解釋器也必須要對餘下的程序語句能解釋(這句好像是廢話，但想象一下，上面myecho程序加一些"hello world"的行來，會有效嗎？下面的mysed程序中的s/UNIX/unix/p也是一樣的道理)。像awk,perl,bash等程序對#開頭的行當成註釋行處理，就能寫成有用的腳本。
再看下面的mysed程序，

代碼:

#!/bin/sed -f s/UNIX/unix/p

執行./mysed時出錯了。因爲被解釋成了"/bin/sed -f ./mysed"，其中-f選項是表示以文件裏的內容作爲sed的命令輸入,但sed的命令輸入不能對"#!/bin/sed -f"解釋，那麼程序出錯了。
所以，有用的解釋器應該是類似bash,perl,awk的程序，並且能對一些規定的語句有解釋功能的。下面給出一個awk程序寫的統計文件行數和單詞數的腳本程序myawk。

代碼:

#!/usr/bin/awk -f BEGIN { sum = 0; } {sum += NF;} END { printf("file /"%s/" have %d line, %d words./n", FILENAME, NR, sum); }

設置執行位之後，執行如下：

代碼:

$ echo -e "hi/nhello world">test.txt $ ./myawk test.txt file "test.txt" have 2 line, 3 words

這裏執行./myawk被執行成“/usr/bin/awk -f ./myawk test.txt”，因爲awk的命令中，以#開頭的行被認爲是註釋行而忽略，awk忽略了第一行"#!/usr/bin/awk -f"，正確的以非#開頭行當成模式和命令的輸入並能對其解釋，所以這個程序是正確的，能被順利地執行。

OK，關於Linux系統的解釋器的介紹就說到這了，希望大家能對解釋器的原理有更多的認識，而不是給我越說越糊塗^_^。

參考文獻：W.Richard Stevens著 Advanced Programming in the UNIX Environment

大頭碼農

發佈了10 篇原創文章 · 獲贊 1 · 訪問量 7萬+

私信關注

unix解釋器原理

前自增和後自增運算符的重載

簡易的windows下命令行統計程序運行時間程序

不定參數應用2

控制檯窗口界面編程控制

不定參數的應用1

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結