JavaScript世界的一等公民 - 函數

簡介

在很多傳統語言(C/C++/Java/C#等)中,函數都是作爲一個二等公民存在,你只能用語言的關鍵字聲明一個函數然後調用它,如果需要把函數作爲參數傳給另一個函數,或是賦值給一個本地變量,又或是作爲返回值,就需要通過函數指針(function pointer)、代理(delegate)等特殊的方式周折一番。
而在JavaScript世界中函數卻是一等公民,它不僅擁有一切傳統函數的使用方式(聲明和調用),而且可以做到像簡單值一樣賦值、傳參、返回,這樣的函數也稱之爲第一級函數(First-class Function)。不僅如此,JavaScript中的函數還充當了類的構造函數的作用,同時又是一個Function類的實例(instance)。這樣的多重身份讓JavaScript的函數變得非常重要。

一、JavaScript函數入門級

JavaScript函數像一般語言一樣也是遵循先聲明後使用的原則,函數名只能包含字母、數字、下劃線或$,且不能以數字開頭。函數常見的聲明方式有以下兩種:
  1. // 直接聲明函數myfunc  
  2. function myfunc(/* arguments */) {  
  3. }  
  4.   
  5. // 把匿名函數賦值給本地變量myfunc  
  6. var myfunc = function(/* arguments */) {  
  7. }  
注意,上面兩種函數聲明方式存在細微的差別:第一種方式在聲明時就是一個命名的函數,無論是聲明在調用之前調用之後,甚至是不會執行到的位置(例如return語句之後或是永遠不會爲真的分支裏),都在整個作用域可訪問;第二種方式是通過把匿名函數賦值給變量的方式,嚴格意義上說這不是一個函數的聲明(function declaration)而是一個函數表達式(function expression),在賦值之前這個函數不能被任何代碼訪問到,也就是說這個賦值必須在調用之前完成,否則調用時會出現錯誤:"TypeError: undefined is not a function"。例如:
  1. myfunc1(); // 能夠正常調用,因爲myfunc1採用直接聲明的方式  
  2.   
  3. function myfunc1() {  
  4. }  
  5.   
  6. myfunc2(); // 出錯 TypeError: undefined is not a function  
  7.   
  8. var myfunc2 = function() {  
  9. };  

函數的基本調用方式與傳統語言相同用一對括號調用: myfunc()。JavaScript的函數也支持直接或間接的遞歸(recursive)調用,例如經典的斐波那契函數用JavaScript可以這樣實現:
  1. function fib(n) {  
  2.   if (n == 1 || n == 2) {  
  3.     return 1;  
  4.   } else {  
  5.     return fib(n - 2) + fib(n - 1);  
  6.   }  
  7. }  
在JavaScript的函數可以處理變長參數,在函數內部都擁有一個名爲arguments的局部變量,它是一個類數組(array-liked)的對象,裏面包含了所有調用時傳入的參數,有length屬性表示參數的個數。例如:
  1. function test() {  
  2.   alert(arguments.length);  
  3. }  
  4.   
  5. test(1); // 1  
  6. test(1, 'a'); // 2  
  7. test(true, [], {}); // 3  
利用arguments可以實現類似C語言printf的功能,也可以用來實現方法的多態。

二、JavaScript函數進階

2.1 匿名函數和嵌套函數

在JavaScript可以聲明一個沒有名稱的函數,稱爲匿名函數(Anonymouse Function)。同時JavaScript還允許在函數內部聲明函數,稱爲嵌套函數(Nested Function),嵌套函數的作用域爲整個父函數。

在前面函數聲明的部分就看到了匿名函數和嵌套函數的一種用法,由於匿名函數沒有名稱,不會引入新的變量污染上下文環境,而且會帶來新的變量作用域,因此匿名函數常被用來防止全局環境污染。

JavaScript運行時中有一個特殊的全局環境(global object),這個對象上面存放全局的函數和變量,實際開發中經常會使用若干第三方的庫或多個js文件,若不小心在全局對象引入重複的變量或函數聲明,則會造成代碼執行混亂。例如先後引入兩個js文件,分別定義了自己的函數log作爲內部使用,則第二引入的函數會覆蓋第一個的定義且不會拋出任何錯誤,在後續的執行中調用log函數可能會造成錯誤。這時候使用一個匿名函數將整個js內的邏輯包裝起來,就可以避免這種錯誤,這種方法已經被絕大多數開源js庫使用。
  1. (function() { // 匿名函數  
  2.   
  3. function log(msg) {  
  4.     console.log(msg);  
  5. }  
  6.   
  7. // 其他代碼  
  8.   
  9. }()); // 立即執行  
以上代碼就是一個簡單的示例,log函數的作用域被限制在這個匿名函數之內,而匿名函數則因爲被外面一對小括號()包括起來,形成一個函數表達式,表達式的值是一個函數,緊接着一對小括號表示立即執行這個函數,讓原有的代碼正常執行一次。不過,這種方式聲明的函數、通過var聲明的變量等等都是內部的,不能被任何匿名函數以外的代碼訪問到。如果你需要對外暴露一些函數作爲接口的話有如下幾種方法:
  1. var mylib = (function(global) {  
  2.   
  3. function log(msg) {  
  4.   console.log(msg);  
  5. }  
  6.   
  7. log1 = log;  // 法一:利用沒有var的變量聲明的默認行爲,在log1成爲全局變量(不推薦)  
  8.   
  9. global.log2 = log;  // 法二:直接在全局對象上添加log2屬性,賦值爲log函數(推薦)  
  10.   
  11. return {  // 法三:通過匿名函數返回值得到一系列接口函數集合對象,賦值給全局變量mylib(推薦)  
  12.    log: log  
  13. };  
  14.   
  15. }(window));  
2.2 高階函數(High-order Function)
如果函數作爲參數或返回值使用時,就稱爲高階函數,JavaScript中的函數都可以作爲高階函數來使用,這也是第一類函數的特徵。下面我們就分別分析一下這兩種使用方法。
  1. function negative(n) {  
  2.   return -n; // 取n的相反值  
  3. }  
  4.   
  5. function square(n) {  
  6.   return n*n; // n的平方  
  7. }  
  8.   
  9. function process(nums, callback) {  
  10.   var result = [];  
  11.   
  12.   for(var i = 0, length = nums.length; i < length; i++) {  
  13.     result[i] = callback(nums[i]); // 對數組nums中的所有元素傳遞給callback進行處理,將返回值作爲結果保存  
  14.   }  
  15.   
  16.   return result;  
  17. }  
  18.   
  19. var nums = [-3, -2, -1, 0, 1, 2, 3, 4];  
  20. var n_neg = process(nums, negative);  
  21. // n_neg = [3, 2, 1, 0, -1, -2, -3, -4];  
  22. var n_square = process(nums, square);  
  23. // n_square = [9, 4, 1, 0, 1, 4, 9, 16];  

以上代碼展示了把函數作爲參數傳入另一個函數process調用的示例,在process函數的實現中,把callback作爲一個黑盒子看待,負責把參數傳給它,然後獲取返回值,在調用之前並不清楚callback的具體實現。只有當執行到20行和22行時,callback才被分別代表negative或square,分別對每個元素進行取相反值或平方值的操作。
  1. function generator() {  
  2.   var i = 0;  
  3.   return function() {  
  4.     return i++;  
  5.   };  
  6. }  
  7.   
  8. var gen1 = generator(); // 得到一個自然數生成器  
  9. var gen2 = generator(); // 得到另一個自然數生成器  
  10. var r1 = gen1(); // r1 = 0  
  11. var r2 = gen1(); // r2 = 1  
  12. var r3 = gen2(); // r3 = 0  
  13. var r4 = gen2(); // r4 = 1  

上面的代碼展示了把函數作爲返回值的示例,generator是一個自然數生成器函數,返回值是一個自然數生成函數。每次調用generator時都會把一個匿名函數作爲結果返回,這個匿名函數在被實際調用時依次返回每個自然數。在generator裏的變量i在每次調用這個匿名函數時都會自增1,這其實就是一個閉包。下面我們來介紹一下閉包.


2.3 閉包(Closure)
閉包(Closure)並不是一個新鮮的概念,很多函數式語言中都使用了閉包。在JavaScript中,當你在內嵌函數中使用外部函數作用域內的變量時,就是使用了閉包。用一個常用的類比來解釋閉包和類(Class)的關係:類是帶函數的數據,閉包是帶數據的函數。
閉包中使用的變量有一個特性,就是它們不在父函數返回時釋放,而是隨着閉包生命週期的結束而結束。比如像上一節中generator的例子,gen1和gen2分別使用了相互獨立的變量i(在gen1的i自增1的時候,gen2的i並不受影響,反之亦然),只要gen1或gen2這兩個變量沒有被JavaScript引擎垃圾回收,他們各自的變量i就不會被釋放。在JavaScript編程中,不知不覺就會使用到閉包,閉包的這個特性在帶來易用的同時,也容易帶來類似內存泄露的問題。例如:
  1. var elem = document.getElementById('test');  
  2. elem.addEventListener('click'function() {  
  3.   alert('You clicked ' + elem.tagName);  
  4. });  
這段代碼的作用是點擊一個結點時顯示它的標籤名稱,它把一個匿名函數註冊爲一個DOM結點的click事件處理函數,函數內引用了一個DOM對象elem,就形成了閉包。這就會產生一個循環引用,即:DOM->閉包->DOM->閉包...DOM對象在閉包釋放之前不會被釋放;而閉包作爲DOM對象的事件處理函數存在,所以在DOM對象釋放前閉包不會釋放,即使DOM對象在DOM tree中刪除,由於這個循環引用的存在,DOM對象和閉包都不會被釋放。可以用下面的方法可以避免這種內存泄露:
  1. var elem = document.getElementById('test');  
  2. elem.addEventListener('click'function() {  
  3.   alert('You clicked ' + this.tagName); // 不再直接引用elem變量  
  4. });  
上面這段代碼中用this代替elem(在DOM事件處理函數中this指針指向DOM元素本身),讓JS運行時不再認爲這個函數中使用了父類的變量,因此不再形成閉包。
閉包還會帶來很多類似的內存泄露問題,只有在寫代碼的時候着重注意一下閉包,儘量避免此類的問題產生。

2.4 類構造函數
JavaScript的函數同時作爲類的構造函數,因此只要聲明一個函數就可以使用new關鍵字創建類的實例。
  1. function Person(name) {  
  2.   this.name = name;  
  3.   this.toString = function() {  
  4.     return 'Hello, ' + this.name + '!';  
  5.   };  
  6. }  
  7.   
  8. var p = new Person('Ghostheaven');  
  9. alert(p); // Hello, Ghostheaven!  
在以上實例中Person函數作爲類的構造函數使用,此時this指向新創建的實例對象,可以爲實例增加屬性和方法,關於詳細的面向對象的JavaScript編程可以參考這篇文章。這裏我想要說的是,JavaScript函數作爲類構造函數使用時的返回值問題。
  1. function MyClass(name) {  
  2.   this.name = name;  
  3.   return name;  // 構造函數的返回值?  
  4. }  
  5.   
  6. var obj1 = new MyClass('foo');  
  7. var obj2 = MyClass('foo');  
  8. var obj3 = new MyClass({});  
  9. var obj4 = MyClass({});  

上面的構造函數比較特別,有返回語句,那麼obj1~obj4分別指向什麼對象呢?實際結果是這樣的:
  • obj1 = MyClass對象
  • obj2 = 'foo'
  • obj3 = {}
  • obj4 = {}
具體原因這篇文章有解釋,本文不再贅述,由於帶返回值的構造函數會產生奇怪的結果,因此不要在構造函數中調用有返回值的返回語句(空return可以)。

三、JavaScript函數妖怪級

歡迎來到妖怪級函數授課區,在這裏會交給你如何淡定自如地面對老怪。。。

3.1 Function類
在JavaScript運行時中有一個內建的類叫做Function,用function關鍵字聲明一個函數其實是創建Function類對象的一種簡寫形式,所有的函數都擁有Function類所有的方法,例如call、apply、bind等等,可以通過instanceof關鍵字來驗證這個說法。
既然Function是一個類,那麼它的構造函數就是Function(它本身也是Function類的對象),應該可以通過new關鍵字來生成一個函數對象。第一個妖怪來了,那就是如何用Function類構造一個函數。Function的語法如下:
  1. new Function ([arg1[, arg2[, ... argN]],] functionBody)  
其中arg1, arg2, ... argN是字符串,代表參數名稱,functionBody也是字符串,表示函數體,前面的參數名稱是可多可少的,Function的構造函數會把最後一個參數當做函數體,前面的都當做參數處理。
  1. var func1 = new Function('name''return "Hello, " + name + "!";');  
  2. func1('Ghostheaven'); // Hello, Ghostheaven!  
以上方法就通過Function構造了一個函數,這個函數跟其他用function關鍵字聲明的函數一模一樣。
看到這兒,很多人可能會問爲什麼需要這樣一個妖怪呢?“存在的即是合理的”,Function類有它獨特的用途,你可以利用它動態地生成各種函數邏輯,或者代替eval函數的功能,而且能保持當前環境不會被污染*。


3.2 自更新函數(Self-update Function)
在很多語言中,函數一旦聲明過就不能再次聲明同名函數,否則會產生語法錯誤,而在JavaScript中的函數不僅可以重複聲明,而且還可以自己更新自己。自己吃自己的妖怪來了!
  1. function selfUpdate() {  
  2.   window.selfUpdate = function() {  
  3.     alert('second run!');  
  4.   };  
  5.   
  6.   alert('first run!');  
  7. }  
  8.   
  9. selfUpdate(); // first run!  
  10. selfUpdate(); // second run!  
這種函數可以用於只運行一次的邏輯,在第一次運行之後就整個替換成一段新的邏輯。

小結

JavaScript的函數灰常強大,在漂亮地解決很多問題的同時,也帶來很多負面問題。妖怪級別的函數使用方法通常是一些鮮爲人知的用法,除非特別必要不要輕易使用,否則會造成代碼閱讀困難,影響團隊開發效率。

* 在新的ECMAScript中引入了嚴格模式,在嚴格模式下eval函數受到了很大的限制,也能夠保證環境不被污染
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章