150道大數據面試題

本次 Chat 的宗旨是讓一些沒有經歷過面試的同學能夠通過我列舉出的一些面試題,從而將自己的知識點做一個詳細的串聯。文中不會對某一個知識點展開詳細的教學,希望讀者能當成一個複習的大綱。

首先我們先來談一談什麼是大數據。 其實大數據並不是一種概念,可以概括爲兩個方向,一種是精準化定製開發,另一種是預測。比如現在比較流行的推薦算法等。那麼怎麼樣才能成爲技術大牛呢?首先要選對學習的方向,比如現在市場上主流的兩種語言 Pyhon 和 Java,如果你有這兩門語言的基礎,那麼在大數據方向會減少很多麻煩。其次要掌握學習的重點,掌握大數據結構,逐步一次學習,並且要經常複習,代碼要反覆練習,不是今天會了就代表永遠都會。

現在我來列舉一下面試中常問的問題,部分問題我不會給出答案,請大家根據自己的實際情況酌情回答。首先給大家展示一下一般企業的項目流程大家可以順着這條路線進行復習。

1. ConcurrentHashMap 是怎麼實現的?

答:concurrent 包中線程安全的哈希表,採用分段鎖,可以理解爲把一個大的 Map 拆分成 N 個小的 HashTable,根據 key.hashCode() 來決定把 key 放到哪個 HashTabl 中。在 ConcurrentHashMap 中,就是把 Map 分成了 N 個 Segment,put 和 get 的時候,都是現根據 key.hashCode() 算出放到哪個 Segment 中。

2. sparksql 和 sparkstreaming 哪個比較熟

答:都還行,SparkSql 的 DataFrame 或者 DataSet 和 SparkS

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章