Spark教程(三) Spark 學習資源

SQL

  • 入門課程:https://www.codecademy.com/learn/learn-sql
  • 入門資料:http://www.w3school.com.cn/sql/
  • 實踐:http://www.mysqltutorial.org/

入門階段,跟着敲一遍就好。實踐部分建議把 basic 的過一遍。

Spark

  • 官網:Spark Overview,需要注意的是選擇哪個版本,一般就選最新的吧
  • Spark repo:apache/spark,官方倉庫,配合上面的講解,敲一遍下來,主要是examples/src/main/scala/org/apache/spark/examples/這個目錄下的例子
  • 博客:Jacek Laskowski,大佬給我推薦的

Scala

  • A Tour of Scala 這個比較基礎
  • Scala Exercises 這個內容還是挺多的,到現在還沒敲完

基本上把上面兩個網站擼完,Scala就差不多了。scala還是和Python挺像的。

爲什麼要學Scala,因爲不想用Python去寫Spark

怎麼學

首先需要掌握的就是SQL語法和Scala語法,然後就跟着官網案例去敲代碼,瞭解RDDs,DataFrame、Datasets的基本操作。如果公司有實際項目,跟着過一遍,就會好很多,我現在就處於這個階段,歡迎和我交流。

我會把學習Spark的過程都放在這個repo裏:learning-spark

微信沒鏈接,可以在閱讀原文中找到

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章