解釋器與編譯器（本文轉自：http://blog.chinaunix.net/uid-22363424-id-113275.html）

本文轉自：http://blog.chinaunix.net/uid-22363424-id-113275.html

1. 在具體計算機上實現一種語言，首先要確定的是表示該語言語義解釋的虛擬計算機，一個關鍵的問題是程序執行時的基本表示是實際計算機上的機器語言還是虛擬機的機器語言。這個問題決定了語言的實現。根據這個問題的回答，可以將程序設計語言劃分爲兩大類：編譯型語言和解釋型語言。

2. 由編譯型語言編寫的源程序需要經過編譯、彙編和鏈接才能輸出目標代碼，然後機器執行目標代碼，得出運行結果，目標代碼由機器指令組成，一般不能獨立運行，因爲源程序中可能使用了某些彙編程序不能解釋引用的庫函數，而庫函數代碼又不在源程序中，此時還需要鏈接程序完成外部引用和目標模塊調用的鏈接任務，最後輸出可執行代碼。C、C++、Fortran、Pascal、Ada都是編譯實現的。

3. 解釋型語言的實現中，翻譯器並不產生目標機器代碼，而是產生易於執行的中間代碼，這種中間代碼與機器代碼是不同的，中間代碼的解釋是由軟件支持的，不能直接使用硬件，軟件解釋器通常會導致執行效率較低。用解釋型語言編寫的程序是由另一個可以理解中間代碼的解釋程序執行的。與編譯程序不同的是，解釋程序的任務是逐一將源程序的語句解釋成可執行的機器指令，不需要將源程序翻譯成目標代碼後再執行。對於解釋型Basic語言，需要一個專門的解釋器解釋執行 Basic程序，每條語言只有在執行才被翻譯。這種解釋型語言每執行一次就翻譯一次，因而效率低下。

4. Java很特殊，Java程序也需要編譯，但是沒有直接編譯稱爲機器語言，而是編譯稱爲字節碼，然後在Java虛擬機上用解釋方式執行字節碼。Python 的也採用了類似Java的編譯模式，先將Python程序編譯成Python字節碼，然後由一個專門的Python字節碼解釋器負責解釋執行字節碼。

(Java虛擬機對字節碼的執行相當於模擬一個cpu，而ruby1.8--在虛擬機還未出現前--是通過解釋成語法樹執行。)

5. 一般地，動態語言都是解釋型的，如Tcl、Perl、Ruby、VBScript、 JavaScript等。

爲了讓更多的人能夠從本質上理解編譯器和解釋器的區別，我杜撰了一個小故事

來福與旺財的養牛場

來福和旺財有一個養牛場。本來養牛不是一件太難的事情，但是偏偏他倆養的牛都有特別的怪癖。奶牛阿圓只吃切成圓形的牧草，而奶牛阿方和阿三（印度來的？）分別只吃切成正方形和三角形的牧草。如果來福和旺財拿不和奶牛性格的草去餵食，阿X們不但不產奶而且還會鄙視來福和旺財。

於是來福和旺財分別有了自己的主意

來福的方案：
來福發明了三套大型碾碎機：圓圓碾碎機，方方碾碎機和三三碾碎機。每天收割了牧草，就分別放到這三套機器裏碾碎給三頭奶牛吃。但是一旦被碾碎了，這堆草就只能給某一頭牛吃了。很明顯阿方是不會吃給阿圓準備的草的。而且來福每天都要操作這三臺機器，覺得比較麻煩。

旺財的方案：
旺財在考察了來福的方案後，發現每天操作三臺機器真的很麻煩，而且有時有的牛吃不完，有的牛不夠吃時，還不能在奶牛之間調配碾碎了的牧草。所以旺財有了不同的想法：口罩型碾碎機。

就像在圖上看到的，旺財給每頭奶牛裝配了一臺口罩碾碎機，所以三頭牛完全可以在一個槽裏吃草了，在吃之前口罩會自動把牧草碾碎成適合該牛食用的類型。旺財就輕鬆了，他每天只需要割割草就行了。

但是旺財被鄙視了？？？

是的，被來福鄙視了。來福觀察後發現，旺財的口罩碾碎機的效率很低（因爲比較小嘛）。阿圓食量大，吃來福的圓圓碾碎機的食物一個小時就飽了，但是戴着口罩吃的時候要吃十個小時！所以來福認爲旺財的口罩碾碎機雖然省事，但只能喂喂小牛，完全不適合食量大的牛。

旺財也覺得這樣做有問題，但他不想回到來福方案上，他改進了口罩方案：牧草預切割機。

呵呵，看到預切割做了什麼嗎？它把牧草割得小了一些，所以需要口罩碾碎機做的事情就少多了。（當然口罩碾碎機也要作適當改進適合預切割後的牧草，所以圖上用藍色表示）阿圓以前用口罩不是要吃十個小時嗎，現在兩三個小時就可以了。

編譯器與解釋器

好的，謝謝你有耐心看到這裏，經過上面那個不太恰當的例子，相信你已經相當的糊塗了。那麼我們試着回到技術方面來。
在上面的例子中
牧草＝我們的各種編程語言，C/C++/C#, Java, Pascal, PHP, Python, Perl, Java Script等等
切割機＝各種編譯器
奶牛＝各種CPU（不要告訴我Intel和AMD哦），比如x86，ARM，MIPS等等
那你應該知道了爲什麼奶牛會有吃不同形狀牧草的嗜好了，這個奇怪的比喻是爲了表示不同的CPU接受的不同的機器語言。

對應上面的奶牛圖，編譯器的圖是這樣的

源代碼被編譯成機器碼，在CPU上運行。

而解釋器是這樣的

用解釋器很方便，只需要直接“運行”就好了，不用像C那樣有編譯鏈接的工序。

爲什麼說這些語言是跨平臺的？因爲你寫了程序以後，如果這個平臺上有這種語言的解釋器，只需要拿到這個平臺上直接運行就可以了。你可以理解爲：解釋器是在“一邊編譯，一邊運行”，它只是把以前程序員手工做的編譯過程放在了運行程序的時候進行。

爲什麼我們一般說解釋器的效率比較低？你也可以想象的是，一段程序在解釋器中運行時可能會被編譯多次，因爲每次運行到這段程序時，都會重新編譯一次，這樣的開銷是很大的。

所以誕生了Java，C#這樣的預編譯語言：

在運行之前，需要手動把源代碼編譯成中間代碼（Java裏叫字節碼），然後在解釋器中執行。
這種架構避免了上面純解釋器中編譯源代碼的開銷，所以相對會有效率一些。

但是我不能騙你們，其實我畫在純解釋器中的Python，Perl，PHP可能都不會是真的純解釋執行的，這樣實在是太沒有效率。Python在運行時會生成pyc的二進制臨時文件，看起來很像是預編譯的結果。只有JavaScript這種真的不會寫得太長的語言（Ajax請原諒我）纔會採用純解釋的運行方式。