JavaScript運行原理解析

原文：http://blog.csdn.net/liaodehong/article/details/50488098

一、寫在前面的話：

發現使用了那麼長時間的Javascript，但是對其運行原理還是不清晰，今天特意總結一下，把大神們的理論和自己的總結都記錄到下面；

1. 什麼是JavaScript解析引擎？

簡單地說，JavaScript解析引擎就是能夠“讀懂”JavaScript代碼，並準確地給出代碼運行結果的一段程序。比方說，當你寫了 var a = 1 + 1; 這樣一段代碼，JavaScript引擎做的事情就是看懂（解析）你這段代碼，並且將a的值變爲2。

學過編譯原理的人都知道，對於靜態語言來說（如Java、C++、C），處理上述這些事情的叫編譯器（Compiler），相應地對於JavaScript這樣的動態語言則叫解釋器（Interpreter）。這兩者的區別用一句話來概括就是：編譯器是將源代碼編譯爲另外一種代碼（比如機器碼，或者字節碼），而解釋器是直接解析並將代碼運行結果輸出。比方說，firebug的console就是一個JavaScript的解釋器。

但是，現在很難去界定說，JavaScript引擎它到底算是個解釋器還是個編譯器，因爲，比如像V8（Chrome的JS引擎），它其實爲了提高JS的運行性能，在運行之前會先將JS編譯爲本地的機器碼（native machine code），然後再去執行機器碼（這樣速度就快很多），相信大家對JIT（Just In Time Compilation）一定不陌生吧。

我個人認爲，不需要過分去強調JavaScript解析引擎到底是什麼，瞭解它究竟做了什麼事情我個人認爲就可以了。對於編譯器或者解釋器究竟是如何看懂代碼的，翻出大學編譯課的教材就可以了。這裏還要強調的就是，JavaScript引擎本身也是程序，代碼編寫而成。比如V8就是用C/C++寫的。

2. JavaScript解析引擎與ECMAScript是什麼關係？

JavaScript引擎是一段程序，我們寫的JavaScript代碼也是程序，如何讓程序去讀懂程序呢？這就需要定義規則。比如，之前提到的var a = 1 + 1;，它表示：

左邊var代表了這是申明（declaration），它申明瞭a這個變量
右邊的+表示要將1和1做加法
中間的等號表示了這是個賦值語句
最後的分號表示這句語句結束了

上述這些就是規則，有了它就等於有了衡量的標準，JavaScript引擎就可以根據這個標準去解析JavaScript代碼了。那麼這裏的ECMAScript就是定義了這些規則。其中ECMAScript 262這份文檔，就是對JavaScript這門語言定義了一整套完整的標準。其中包括：

var，if，else，break，continue等是JavaScript的關鍵詞
abstract，int，long等是JavaScript保留詞
怎麼樣算是數字、怎麼樣算是字符串等等
定義了操作符（+，-，>，<等）
定義了JavaScript的語法
定義了對表達式，語句等標準的處理算法，比如遇到==該如何處理
⋯⋯

標準的JavaScript引擎就會根據這套文檔去實現，注意這裏強調了標準，因爲也有不按照標準來實現的，比如IE的JS引擎。這也是爲什麼JavaScript會有兼容性的問題。至於爲什麼IE的JS引擎不按照標準來實現，就要說到瀏覽器大戰了，這裏就不贅述了，自行Google之。

所以，簡單的說，ECMAScript定義了語言的標準，JavaScript引擎根據它來實現，這就是兩者的關係。

3. JavaScript解析引擎與瀏覽器又是什麼關係？

簡單地說，JavaScript引擎是瀏覽器的組成部分之一。因爲瀏覽器還要做很多別的事情，比如解析頁面、渲染頁面、Cookie管理、歷史記錄等等。那麼，既然是組成部分，因此一般情況下JavaScript引擎都是瀏覽器開發商自行開發的。比如：IE9的Chakra、Firefox的TraceMonkey、Chrome的V8等等。

從而也看出，不同瀏覽器都採用了不同的JavaScript引擎。因此，我們只能說要深入瞭解哪個JavaScript引擎。

4.爲什麼JavaScript是單線程？

JavaScript語言的一大特點就是單線程，也就是說，同一個時間只能做一件事。那麼，爲什麼JavaScript不能有多個線程呢？這樣能提高效率啊。

JavaScript的單線程，與它的用途有關。作爲瀏覽器腳本語言，JavaScript的主要用途是與用戶互動，以及操作DOM。這決定了它只能是單線程，否則會帶來很複雜的同步問題。比如，假定JavaScript同時有兩個線程，一個線程在某個DOM節點上添加內容，另一個線程刪除了這個節點，這時瀏覽器應該以哪個線程爲準？

所以，爲了避免複雜性，從一誕生，JavaScript就是單線程，這已經成了這門語言的核心特徵，將來也不會改變。

爲了利用多核CPU的計算能力，HTML5提出Web Worker標準，允許JavaScript腳本創建多個線程，但是子線程完全受主線程控制，且不得操作DOM。所以，這個新標準並沒有改變JavaScript單線程的本質。

二、任務隊列

單線程就意味着，所有任務需要排隊，前一個任務結束，纔會執行後一個任務。如果前一個任務耗時很長，後一個任務就不得不一直等着。

如果排隊是因爲計算量大，CPU忙不過來，倒也算了，但是很多時候CPU是閒着的，因爲IO設備（輸入輸出設備）很慢（比如Ajax操作從網絡讀取數據），不得不等着結果出來，再往下執行。

JavaScript語言的設計者意識到，這時主線程完全可以不管IO設備，掛起處於等待中的任務，先運行排在後面的任務。等到IO設備返回了結果，再回過頭，把掛起的任務繼續執行下去。

於是，所有任務可以分成兩種，一種是同步任務（synchronous），另一種是異步任務（asynchronous）。同步任務指的是，在主線程上排隊執行的任務，只有前一個任務執行完畢，才能執行後一個任務；異步任務指的是，不進入主線程、而進入"任務隊列"（task queue）的任務，只有"任務隊列"通知主線程，某個異步任務可以執行了，該任務纔會進入主線程執行。

具體來說，異步執行的運行機制如下。（同步執行也是如此，因爲它可以被視爲沒有異步任務的異步執行。）

（1）所有同步任務都在主線程上執行，形成一個執行棧（execution context stack）。
（2）主線程之外，還存在一個"任務隊列"（task queue）。只要異步任務有了運行結果，就在"任務隊列"之中放置一個事件。
（3）一旦"執行棧"中的所有同步任務執行完畢，系統就會讀取"任務隊列"，看看裏面有哪些事件。那些對應的異步任務，於是結束等待狀態，進入執行棧，開始執行。
（4）主線程不斷重複上面的第三步。

三、事件和回調函數

"任務隊列"是一個事件的隊列（也可以理解成消息的隊列），IO設備完成一項任務，就在"任務隊列"中添加一個事件，表示相關的異步任務可以進入"執行棧"了。主線程讀取"任務隊列"，就是讀取裏面有哪些事件。

"任務隊列"中的事件，除了IO設備的事件以外，還包括一些用戶產生的事件（比如鼠標點擊、頁面滾動等等）。只要指定過回調函數，這些事件發生時就會進入"任務隊列"，等待主線程讀取。

所謂"回調函數"（callback），就是那些會被主線程掛起來的代碼。異步任務必須指定回調函數，當主線程開始執行異步任務，就是執行對應的回調函數。

"任務隊列"是一個先進先出的數據結構，排在前面的事件，優先被主線程讀取。主線程的讀取過程基本上是自動的，只要執行棧一清空，"任務隊列"上第一位的事件就自動進入主線程。但是，由於存在後文提到的"定時器"功能，主線程首先要檢查一下執行時間，某些事件只有到了規定的時間，才能返回主線程。

四、Event Loop

主線程從"任務隊列"中讀取事件，這個過程是循環不斷的，所以整個的這種運行機制又稱爲Event Loop（事件循環）。

爲了更好地理解Event Loop，請看下圖（轉引自Philip Roberts的演講《Help, I'm stuck in an event-loop》）。

上圖中，主線程運行的時候，產生堆（heap）和棧（stack），棧中的代碼調用各種外部API，它們在"任務隊列"中加入各種事件（click，load，done）。只要棧中的代碼執行完畢，主線程就會去讀取"任務隊列"，依次執行那些事件所對應的回調函數。

執行棧中的代碼（同步任務），總是在讀取"任務隊列"（異步任務）之前執行。請看下面這個例子。


    var req = new XMLHttpRequest();
    req.open('GET', url);    
    req.onload = function (){};    
    req.onerror = function (){};    
    req.send();

上面代碼中的req.send方法是Ajax操作向服務器發送數據，它是一個異步任務，意味着只有當前腳本的所有代碼執行完，系統纔會去讀取"任務隊列"。所以，它與下面的寫法等價。


    var req = new XMLHttpRequest();
    req.open('GET', url);
    req.send();
    req.onload = function (){};    
    req.onerror = function (){};

也就是說，指定回調函數的部分（onload和onerror），在send()方法的前面或後面無關緊要，因爲它們屬於執行棧的一部分，系統總是執行完它們，纔會去讀取"任務隊列"。

五、定時器

除了放置異步任務的事件，"任務隊列"還可以放置定時事件，即指定某些代碼在多少時間之後執行。這叫做"定時器"（timer）功能，也就是定時執行的代碼。

定時器功能主要由setTimeout()和setInterval()這兩個函數來完成，它們的內部運行機制完全一樣，區別在於前者指定的代碼是一次性執行，後者則爲反覆執行。以下主要討論setTimeout()。

setTimeout()接受兩個參數，第一個是回調函數，第二個是推遲執行的毫秒數。


console.log(1);
setTimeout(function(){console.log(2);},1000);
console.log(3);

上面代碼的執行結果是1，3，2，因爲setTimeout()將第二行推遲到1000毫秒之後執行。

如果將setTimeout()的第二個參數設爲0，就表示當前代碼執行完（執行棧清空）以後，立即執行（0毫秒間隔）指定的回調函數。


setTimeout(function(){console.log(1);}, 0);
console.log(2);

上面代碼的執行結果總是2，1，因爲只有在執行完第二行以後，系統纔會去執行"任務隊列"中的回調函數。

總之，setTimeout(fn,0)的含義是，指定某個任務在主線程最早可得的空閒時間執行，也就是說，儘可能早得執行。它在"任務隊列"的尾部添加一個事件，因此要等到同步任務和"任務隊列"現有的事件都處理完，纔會得到執行。

HTML5標準規定了setTimeout()的第二個參數的最小值（最短間隔），不得低於4毫秒，如果低於這個值，就會自動增加。在此之前，老版本的瀏覽器都將最短間隔設爲10毫秒。另外，對於那些DOM的變動（尤其是涉及頁面重新渲染的部分），通常不會立即執行，而是每16毫秒執行一次。這時使用requestAnimationFrame()的效果要好於setTimeout()。

需要注意的是，setTimeout()只是將事件插入了"任務隊列"，必須等到當前代碼（執行棧）執行完，主線程纔會去執行它指定的回調函數。要是當前代碼耗時很長，有可能要等很久，所以並沒有辦法保證，回調函數一定會在setTimeout()指定的時間執行。

總結：

以前只是認爲javaScript只是一種簡單的腳本語言而已，但是隨着深入之後慢慢的發現，javaScript還是很複雜的，知識點還是挺多的，JS執行原理大致上已經瞭解了，但是如果想要深入的話，還需要多努力，多看點書，高效能的javaScript和javaScript高級程序設計都還不錯.

JavaScript運行原理解析

3. JavaScript解析引擎與瀏覽器又是什麼關係？

三、事件和回調函數

四、Event Loop

五、定時器

開源高性能結構化日誌模塊NanoLog

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

BAT及各大互聯網公司2014前端筆試面試題：JavaScript篇

NodeJS模塊全局安裝路徑配置

CSS Font知識整理總結

JavaScript運行原理解析

WebView性能、體驗分析與優化

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結