DT大數據夢工廠- 第6課精通Spark集羣搭建與測試

20160106 課程筆記

Spark上流行的存儲框架： Hadoop的 HDFS 和 S3 雲存儲

未來三至五年黃金組合框架：Spark+Tachyon+HDFS

Tachyon: 基於內存的分佈式文件系統, 不同來源的數據,

安裝

VMWare 軟件

電腦推薦16G: 兩個 KINGSTON 8G，至少8G內存

系統推薦UbantuKylin

SecureCRT 工具

使用Hadoop 2.6.0 目前而言，最穩定的版本

Hadoop重要目錄

/usr/local/hadoop/

-2.6.0/

core-site.xml

hdfs-site.xml

mapred-site.xml

yarn-site.xml

hadoop-env.sh

bashrc

配置HADOOP_HOME,SPARK_HOME,SCALA_HOME等信息

slaves

安裝Spark 1.6.0 略

Coarse Grained

粗粒度，先配置資源。細計算時分配

萬一有一個任務完成，其他資源閒着浪費。

Yarn：粗粒度

MESOS 粗、細粒度

作業

安裝Hadoop, Spark環境截圖

發佈PI程序

--------------------------------------------------------------

王家林中國Spark第一人
DT大數據夢工廠
新浪微博： http://weibo.com.ilovepains/
微信公共號：DT_Spark
博客：http://bolg.sina.com.cn/ilovepains
手機：18610086859
qq：1740415547
郵箱：[email protected]

--------------------------------------------------------------

DT大數據夢工廠- 第6課精通Spark集羣搭建與測試

DT大數據夢工廠- 第6課精通Spark集羣搭建與測試

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

DT大數據夢工廠- 第6課 精通Spark集羣搭建與測試

Spark內核天機解密（2016）第三講 Scala函數式編程

第16課：Scala implicits編程徹底實戰

DT_大數據夢工廠 第8課 徹底實戰詳解使用IDE開發Spark程序

DT大數據夢工廠- 第5講 隱式轉換和併發編程

DT大數據夢工廠- 第6課 精通Spark集羣搭建與測試

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

DT大數據夢工廠- 第6課精通Spark集羣搭建與測試

DT_大數據夢工廠第8課徹底實戰詳解使用IDE開發Spark程序

DT大數據夢工廠- 第5講隱式轉換和併發編程

DT大數據夢工廠- 第6課精通Spark集羣搭建與測試