JAVA8 Stream API 入門

文章摘自公衆號importNew:

http://mp.weixin.qq.com/s?__biz=MjM5NzMyMjAwMA==&mid=2651478419&idx=2&sn=43bc178f3b1c9608a99e43d78af948ad&chksm=bd2535ec8a52bcfae142bf93bd8990b7ca5e172200b9368ce79c132fbe10fb61e69f29662cd7&mpshare=1&scene=23&srcid=0608kCPpzncYjWy02bJcs8Ij#rd

有興趣的同學可以關注這個公衆號。



你可能沒意識到Java對函數式編程的重視程度,看看Java 8加入函數式編程擴充多少功能就清楚了。Java 8之所以費這麼大功夫引入函數式編程,原因有二:


代碼簡潔,函數式編程寫出的代碼簡潔且意圖明確,使用stream接口讓你從此告別for循環。


多核友好,Java函數式編程使得編寫並行程序從未如此簡單,你需要的全部就是調用一下parallel()方法。


這一節我們學習stream,也就是Java函數式編程的主角。對於Java 7來說stream完全是個陌生東西,stream並不是某種數據結構,它只是數據源的一種視圖。這裏的數據源可以是一個數組,Java容器或I/O channel等。正因如此要得到一個stream通常不會手動創建,而是調用對應的工具方法,比如:


  • 調用Collection.stream()或者Collection.parallelStream()方法;

  • 調用Arrays.stream(T[] array)方法。


常見的stream接口繼承關係如圖:



圖中4種stream接口繼承自BaseStream,其中IntStream, LongStream, DoubleStream對應三種基本類型(int, long, double,注意不是包裝類型),Stream對應所有剩餘類型的stream視圖。爲不同數據類型設置不同stream接口,可以1.提高性能,2.增加特定接口函數。



你可能會奇怪爲什麼不把IntStream等設計成Stream的子接口?畢竟這接口中的方法名大部分是一樣的。答案是這些方法的名字雖然相同,但是返回類型不同,如果設計成父子接口關係,這些方法將不能共存,因爲Java不允許只有返回類型不同的方法重載。


雖然大部分情況下stream是容器調用Collection.stream()方法得到的,但stream和collections有以下不同:


  • 無存儲。stream不是一種數據結構,它只是某種數據源的一個視圖,數據源可以是一個數組,Java容器或I/O channel等。


  • 爲函數式編程而生。對stream的任何修改都不會修改背後的數據源,比如對stream執行過濾操作並不會刪除被過濾的元素,而是會產生一個不包含被過濾元素的新stream。


  • 惰式執行。stream上的操作並不會立即執行,只有等到用戶真正需要結果的時候纔會執行。


  • 可消費性。stream只能被“消費”一次,一旦遍歷過就會失效,就像容器的迭代器那樣,想要再次遍歷必須重新生成。


對stream的操作分爲爲兩類,中間操作(intermediate operations)和結束操作(terminal operations),二者特點是:


  1. 中間操作總是會惰式執行,調用中間操作只會生成一個標記了該操作的新stream,僅此而已。


  2. 結束操作會觸發實際計算,計算髮生時會把所有中間操作積攢的操作以pipeline的方式執行,這樣可以減少迭代次數。計算完成之後stream就會失效。


如果你熟悉Apache Spark RDD,對stream的這個特點應該不陌生。


下表彙總了Stream接口的部分常見方法:




區分中間操作和結束操作最簡單的方法,就是看方法的返回值,返回值爲stream的大都是中間操作,否則是結束操作。


stream方法使用


stream跟函數接口關係非常緊密,沒有函數接口stream就無法工作。回顧一下:函數接口是指內部只有一個抽象方法的接口。通常函數接口出現的地方都可以使用Lambda表達式,所以不必記憶函數接口的名字。


forEach()


我們對forEach()方法並不陌生,在Collection中我們已經見過。方法簽名爲void forEach(Consumer<? super E> action),作用是對容器中的每個元素執行action指定的動作,也就是對元素進行遍歷。


// 使用Stream.forEach()迭代

Stream<String> stream = Stream.of("I", "love", "you", "too");

stream.forEach(str -> System.out.println(str));


由於forEach()是結束方法,上述代碼會立即執行,輸出所有字符串。


filter()




函數原型爲Stream<T> filter(Predicate<? super T> predicate),作用是返回一個只包含滿足predicate條件元素的Stream。


// 保留長度等於3的字符串

Stream<String> stream= Stream.of("I", "love", "you", "too");

stream.filter(str -> str.length()==3)

    .forEach(str -> System.out.println(str));


上述代碼將輸出爲長度等於3的字符串you和too。注意,由於filter()是個中間操作,如果只調用filter()不會有實際計算,因此也不會輸出任何信息。


distinct()



函數原型爲Stream<T> distinct(),作用是返回一個去除重複元素之後的Stream。


Stream<String> stream= Stream.of("I", "love", "you", "too", "too");

stream.distinct()

    .forEach(str -> System.out.println(str));


上述代碼會輸出去掉一個too之後的其餘字符串。


sorted()


排序函數有兩個,一個是用自然順序排序,一個是使用自定義比較器排序,函數原型分別爲Stream<T> sorted()和Stream<T> sorted(Comparator<? super T> comparator)。


Stream<String> stream= Stream.of("I", "love", "you", "too");

stream.sorted((str1, str2) -> str1.length()-str2.length())

    .forEach(str -> System.out.println(str));


上述代碼將輸出按照長度升序排序後的字符串,結果完全在預料之中。


map()



函數原型爲<R> Stream<R> map(Function<? super T,? extends R> mapper),作用是返回一個對當前所有元素執行執行mapper之後的結果組成的Stream。直觀的說,就是對每個元素按照某種操作進行轉換,轉換前後Stream中元素的個數不會改變,但元素的類型取決於轉換之後的類型。


Stream<String> stream = Stream.of("I", "love", "you", "too");

stream.map(str -> str.toUpperCase())

    .forEach(str -> System.out.println(str));


上述代碼將輸出原字符串的大寫形式。


flatMap()



函數原型爲<R> Stream<R> flatMap(Function<? super T,? extends Stream<? extends R>> mapper),作用是對每個元素執行mapper指定的操作,並用所有mapper返回的Stream中的元素組成一個新的Stream作爲最終返回結果。說起來太拗口,通俗的講flatMap()的作用就相當於把原stream中的所有元素都”攤平”之後組成的Stream,轉換前後元素的個數和類型都可能會改變。


Stream<List<Integer>> stream = Stream.of(Arrays.asList(1,2), Arrays.asList(3, 4, 5));

stream.flatMap(list -> list.stream())

    .forEach(i -> System.out.println(i));


上述代碼中,原來的stream中有兩個元素,分別是兩個List<Integer>,執行flatMap()之後,將每個List都“攤平”成了一個個的數字,所以會新產生一個由5個數字組成的Stream。所以最終將輸出1~5這5個數字。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章