Spark全面系統(基於Spark2版本+含Spark調優+超多案例)

Apache Spark 是專爲大規模數據處理而設計的快速通用的計算引擎。


Spark是UC Berkeley AMP lab (加州大學伯克利分校的AMP實驗室)所開源的類Hadoop MapReduce的通用並行框架,Spark,擁有Hadoop MapReduce所具有的優點;但不同於MapReduce的是——Job中間輸出結果可以保存在內存中,從而不再需要讀寫HDFS,因此Spark能更好地適用於數據挖掘與機器學習等需要迭代的MapReduce的算法。


316節,課程從Spark相關的各個技術點進行全方位剖析,最後結合實際項目:用戶交互式行爲分析系統、DMP用戶畫像系統,對Spark做了綜合性的應用講解,可以說一套在手,打遍天下無敵手!


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章