Java 的繼位人? - Scala簡介

一兩年前,就見到過Scala,並沒有太多的關注,因爲並不熟悉函數式編程。最近又看到它,靜下心來看了一下並搜索了一些網上資料,發覺也許我們需要關注並學習一下。目前,似乎Microsoft的C#已經開始引入函數式編程,大大簡化了代碼,尤其是原來的範式代碼(boilerplate)。 從資料來看,Scala遠勝C#,他的對手應該是F#。近乎完美的將funtional programming 和 OOP融合在一起,是Scala別具特色。Scala會是Java的繼承人嗎?現在不好講,但它確實具有極大的潛力。雖然目前,各種動態語言非常紅火,但實在無法讓人感冒。小的應用還好,如是企業應用,並碰上幾個NB的所謂developer, 那就只有死翹翹的份了。靜態語言,始終應該是企業應用的最愛。

(以下內容截選自Martin Odersky,Lex Spoon和Bill Venners所著,Regular翻譯的《Programming in Scala》的第一章。)

Scala簡介

“Scala是一門現代的多範式編程語言,志在以簡練、優雅及類型安全的方式來表達常用編程模式。它平滑地集成了面向對象和函數語言的特性。”

Scala意在伸縮性,語言的伸縮性受許多因素影響,範圍從語法細節到控件的抽象構造。如果我們一定要說出Scala中有助伸縮性的一個方面,我們會把面向對象和函數式編程的組合揀出來(呵呵,不厚道了一把,這的確是兩個方面,但是糾纏在了一起)。

Scala在把面向對象和函數式編程熔合成一套語言的設計方面比其他衆所周知的語言都走得更遠。比方說,其他語言或許把對象和方法作爲兩個不同的概念,但在Scala裏,函數值就是對象。函數類型是能夠被子類繼承的類。這看上去似乎不外乎學術上的美感,但它從深層次上影響了可伸展性。實際上之前看到的行動類這個概念如果沒有這種函數和對象的聯合將無法實現。本節將瀏覽Scala融合面向對象和函數概念的方法。

Scala是面向對象的

面向對象編程已經無與倫比地成功了。它開始於(20世紀)60年代中期的Simula和70年代的Smalltalk,現在支持它的語言比不支持的更多。某些領域已經被對象完全接管了。然而並沒有面向對象意味着什麼的明確定義,很明顯對象的某些東西是程序員說了算的。

原則上,面向對象編程的動機非常簡單:除了最瑣碎的程序之外的絕大多數都需要某些結構。做的這點最直接的辦法就是把數據和操作放進某種形式上的容器。面向對象編程裏最偉大的思想是讓這些容器完全地通用化,這樣它們就能像保存數據那樣保存操作,並且它們是自己的值,可以存儲到其他容器裏,或作爲參數傳遞給操作。這樣的容器就被叫做對象。Alan Kay,Smalltalk的發明者,評論說,用這樣的方法最簡單的對象可以與完整的計算機有同樣的架構原則:用形式化的接口綁定數據和操作。 於是對象在語言伸縮性方面起了很大作用:構造小程序和大程序都可以應用同樣的技術。

儘管很長一段時間面向對象編程已經成爲主流,然而鮮有語言能跟從Smalltalk推動這種構造原則去轉化爲邏輯結論。舉例來說,許多語言容忍值不是對象,如Java裏面的原始值。或者它們允許靜態字段和方法不隸屬於任何對象。這些對純理想化面向對象編程的背叛最初看起來完全無害,但它們有一個討厭的趨勢,把事情複雜化並限制了可伸縮性。

相反,Scala是純粹格式的面嚮對象語言:每個值都是對象,每個操作都是方法調用。例如,如果你用Scala描述1 + 2,你實際上調用了定義在Int類裏面一個名爲 + 的方法。你可以用一個像操作符一樣的名字定義方法,這樣你的API的使用者就能按照操作符的標記使用了。這就是前例裏面顯示的Scala的行動類API定義者如何讓你能夠使用類似requester!sum這樣的表達式:“!”是行動類的方法。

如果說到對象組合,Scala比多數別的語言更勝一籌。Scala的特質:trait就是其中一例。所謂特質就像Java的接口,但它們同樣可以有方法實現乃至字段。對象是由混入組成: mixin composition構造的,這種方式使用類的定義並加入一定數量的特質定義構成。用這種方式,不同方面的類可以被包裝入不同的特質。這看上去有點兒像多重繼承,但在細節上是有差異的。與類不同,特質可以可以把一些新的功能加入到還未定義的超類中。這使得特質比類更具有“可加性”。尤其特別的是,它避免了多重繼承裏面,當同樣的類被通過若干不同渠道繼承時發生的,經典的“菱形繼承”問題。

Scala是函數式的

除了作爲一種純面向對象的語言,Scala還是一種“全須全尾兒”的函數式語言。函數式語言的思想早於(電子)計算機。其基礎建立在Alonzo Church於1930年代發展的λ算子(lambda calculus)上。第一個函數式編程語言是50年代後期的Lisp。其他流行的函數式語言有Scheme,SML,Erlang,Haskell,OCaml和F#。很長一段時間,函數式語言處於邊緣地帶,在學府裏流行,但沒有廣泛應用於業界。然而,最近幾年對函數式語言和技術的熱情持續高漲。
函數式編程有兩種理念做指導,第一種理念是函數是第一類值。在函數式語言中,函數也是值,與,比如說,整數或字串,在同一個地位。你可以把函數當作參數傳遞給其他函數,當作結果從函數中返回或保存在變量裏。你也可以在函數裏定義其他函數,就好像在函數裏定義整數一樣。還可以定義匿名函數,就好像你或許會寫像42這樣的整數文本那樣方便地用函數文本拋灑在代碼中。

把函數作爲第一類值爲操作符上的抽象和創建新控制結構提供了便利的方法。這種函數的泛化提供了很強的表現力,常能產生非常易讀和清晰的程序。而且常在伸展性上扮演重要的角色。例如,之前在行動類例子裏演示的receive構造就是一個把函數當作參數調用的方法。receive構造裏面的代碼是個未被執行的傳入receive方法的函數。

相反,在多數傳統語言中,函數不是值。確實有函數值的語言則又常常把它們貶爲二類地位。舉例來說,C和C++的函數指針就不能擁有與非函數指針在語言中同等的地位:函數指針僅能指向全局函數,它們不允許你定義指向環境中什麼值的第一類嵌套函數,也不能定義匿名函數文本。

函數式編程的第二個主要理念是程序的操作符應該把輸入值映射到輸出值而不是就地修改數據。要看到其中的差別,可以考慮一下Ruby和Java對字串的實現。在Ruby裏,字串是一個字符數組。字串中的字符可以被獨立的改變。舉例來說你可以在同一個字串對象裏把分號改成句號。而另一方面,在Java和Scala裏,字串是一種數學意義上的字符序列。使用表達式如s.replace(';', '.')在字串裏替換字符會產生一個新的,不同於原字串s的對象。用另一種表達方式來說就是在Java裏字串是不可變的(immutable)而在Ruby裏是可變的。因此單看字串來說,Java是函數式語言,而Ruby不是。不可變數據結構是函數式語言的一塊基石。Scala庫在Java API之上定義了更多的不可變數據類型。例如,Scala有不可變的列表,元組,映射表和集。

另一種說明函數式編程第二種理念的方式是方法不應有任何副作用:side effect。它們唯一的與所在環境交流的方式應該是獲得參數和返回結果。舉例來說,Java的String類的replace方法符合這個描述。它帶一個字串和兩個字符併產生一個所有一個字符都被另一個替代掉的新字串。調用replace不會有其他的結果。類似於replace這樣的方法被稱爲指稱透明:referentially transparent,就是說方法調用對任何給定的輸入可以用它的結果替代而不會影響程序的語義。

函數式語言鼓勵不可變數據結構和指稱透明的方法。有些函數式語言甚至需要它們。Scala給你選擇。如果你需要,你也可以寫成命令:imperative形式,用可變數據和有副作用的方法調用編程。但是Scala通常可以在你需要的時候輕鬆避免它們,因爲有好的函數式編程方式做替代。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章