下面的程序是什麼結果?
- var foo = 1;
- function bar() {
- if (!foo) {
- var foo = 10;
- }
- alert(foo);
- }
- bar();
那麼下面這個呢?
- var a = 1;
- function b() {
- a = 10;
- return;
- function a() {}
- }
- b();
- alert(a);
嚇你一跳吧?發生了什麼事情?這可能是陌生的,危險的,迷惑的,同樣事實上也是非常有用和印象深刻的JavaScript語言特性。對於這種表現行爲,我不知道有沒有一個標準的稱呼,但是我喜歡這個術語:“Hoisting (變量提升)”。這篇文章將對這種機制做一個拋磚引玉式的講解,但是,首先讓我們對javascript的作用域有一些必要的理解。
Javascript的作用域
對於Javascript初學者來說,一個最迷惑的地方就是作用域;事實上,不光是初學者。我就見過一些有經驗的javascript程序員,但他們對scope理解不深。javascript作用域之所以迷惑,是因爲它程序語法本身長的像C家族的語言,像下面的C程序:
- #include <stdio.h>
- int main() {
- int x = 1;
- printf("%d, ", x); // 1
- if (1) {
- int x = 2;
- printf("%d, ", x); // 2
- }
- printf("%d\n", x); // 1
- }
- var x = 1;
- console.log(x); // 1
- if (true) {
- var x = 2;
- console.log(x); // 2
- }
- console.log(x); // 2
對於很多C,c++,Java程序員來說,這不是他們期望和歡迎的。幸運的是,基於javascript函數的靈活性,這裏有可變通的地方。如果你必須創建臨時的作用域,可以像下面這樣:
- function foo() {
- var x = 1;
- if (x) {
- (function () {
- var x = 2;
- // some other code
- }());
- }
- // x is still 1.
- }
變量聲明,命名,和提升
在javascript,變量有4種基本方式進入作用域:
- 1 語言內置:所有的作用域裏都有this和arguments;(譯者注:經過測試arguments在全局作用域是不可見的)
- 2 形式參數:函數的形式參數會作爲函數體作用域的一部分;
- 3 函數聲明:像這種形式:function foo(){};
- 4 變量聲明:像這樣:var foo;
函數聲明和變量聲明總是會被解釋器悄悄地被“提升”到方法體的最頂部。這個意思是,像下面的代碼:
- function foo() {
- bar();
- var x = 1;
- }
- function foo() {
- var x;
- bar();
- x = 1;
- }
- function foo() {
- if (false) {
- var x = 1;
- }
- return;
- var y = 1;
- }
- function foo() {
- var x, y;
- if (false) {
- x = 1;
- }
- return;
- y = 1;
- }
- function test() {
- foo(); // TypeError "foo is not a function"
- bar(); // "this will run!"
- var foo = function () { // 變量指向函數表達式
- alert("this won't run!");
- }
- function bar() { // 函數聲明 函數名爲bar
- alert("this will run!");
- }
- }
- test();
上面的東西涵蓋了提升的一些基本知識,它們看起來也沒有那麼迷惑。但是,在一些特殊場景,還是有一定的複雜度的。
變量解析順序
最需要牢記在心的是變量解析順序。記得我前面給出的命名進入作用域的4種方式嗎?變量解析的順序就是我列出來的順序。一般來說,如果一個名稱已經被定義,則不會被其他相同名稱的屬性覆蓋。這是說,(譯者沒理解這句,所以先做刪除樣式) 函數的聲明比變量的聲明具有高的優先級。這並不是說給那個變量賦值不管用,而是聲明不會被忽略了。
(譯者注: 關於函數的聲明比變量的聲明具有高的優先級,下面的程序能幫助你理解)
- <script>
- function a(){
- }
- var a;
- alert(a);//打印出a的函數體
- </script>
- <script>
- var a;
- function a(){
- }
- alert(a);//打印出a的函數體
- </script>
- //但是要注意區分和下面兩個寫法的區別:
- <script>
- var a=1;
- function a(){
- }
- alert(a);//打印出1
- </script>
- <script>
- function a(){
- }
- var a=1;
- alert(a);//打印出1
- </script>
這裏有3個例外:
1 內置的名稱arguments表現得很奇怪,他看起來應該是聲明在函數形式參數之後,但是卻在函數聲明之前。這是說,如果形參裏面有arguments,它會比內置的那個有優先級。這是很不好的特性,所以要杜絕在形參裏面使用arguments;
2 在任何地方定義this變量都會出語法錯誤,這是個好特性;
3 如果多個形式參數擁有相同的名稱,最後的那個具有優先級,即便實際運行的時候它的值是undefined;
命名函數
你可以給一個函數一個名字。如果這樣的話,它就不是一個函數聲明,同時,函數體定義裏面的指定的函數名(
如果有的話,如下面的spam, 譯者注)將不會被提升, 而是被忽略。這裏一些代碼幫助你理解:
- foo(); // TypeError "foo is not a function"
- bar(); // valid
- baz(); // TypeError "baz is not a function"
- spam(); // ReferenceError "spam is not defined"
- var foo = function () {}; // foo指向匿名函數
- function bar() {}; // 函數聲明
- var baz = function spam() {}; // 命名函數,只有baz被提升,spam不會被提升。
- foo(); // valid
- bar(); // valid
- baz(); // valid
- spam(); // ReferenceError "spam is not defined"
怎麼寫代碼
現在你理解了作用域和變量提升,那麼這對於javascript編碼意味着什麼?最重要的一點是,總是用var定義你的變量。而且我強烈推薦,對於一個名稱,在一個作用域裏面永遠只有一次var聲明。如果你這麼做,你就不會遇到作用域和變量提升問題。
語言規範怎麼說
我發現ECMAScript參考文檔總是很有用。下面是我找到的關於作用域和變量提升的部分:
如果變量在函數體類聲明,則它是函數作用域。否則,它是全局作用域(作爲global的屬性)。變量將會在執行進入作用域的時候被創建。塊不會定義新的作用域,只有函數聲明和程序(譯者以爲,就是全局性質的代碼執行)纔會創造新的作用域。變量在創建的時候會被初始化爲undefined。如果變量聲明語句裏面帶有賦值操作,則賦值操作只有被執行到的時候纔會發生,而不是創建的時候。
我期待這篇文章會對那些對javascript比較迷惑的程序員帶來一絲光明。我自己也盡最大的可能去避免帶來更多的迷惑。如果我說錯了什麼,或者忽略了什麼,請告知。
譯者補充
xu281828044提醒了我發現了IE下全局作用域下命名函數的提升問題:
我翻譯文章的時候是這麼測試的:
- <script>
- functiont(){
- spam();
- var baz = function spam() {alert('this is spam')};
- }
- t();
- </script>
- <script>
- spam();
- var baz = function spam() {alert('this is spam')};
- </script>
這個問題還引導我思考了另2個問題,1:對於全局作用於範圍的變量,var與不var是有區別的. 沒有var的寫法,其變量不會被提升。比如下面兩個程序,第二個會報錯:
- <script>
- alert(a);
- var a=1;
- </script>
- <script>
- alert(a);
- a=1;
- </script>
2: eval中創建的局部變量是不會被提升的(它也沒辦法做到).
- <script>
- var a = 1;
- function t(){
- alert(a);
- eval('var a = 2');
- alert(a);
- }
- t();
- alert(a);
- </script>