DT大數據夢工廠- 第6課 精通Spark集羣搭建與測試

20160106 課程筆記

Spark上流行的存儲框架: Hadoop的 HDFS 和 S3 雲存儲 


未來三至五年黃金組合框架:Spark+Tachyon+HDFS
Tachyon: 基於內存的分佈式文件系統, 不同來源的數據,

安裝
VMWare 軟件
電腦推薦16G: 兩個 KINGSTON 8G,至少8G內存
系統推薦UbantuKylin
SecureCRT 工具 

使用Hadoop 2.6.0 目前而言,最穩定的版本

Hadoop重要目錄

/usr/local/hadoop/
-2.6.0/
core-site.xml
hdfs-site.xml
mapred-site.xml
yarn-site.xml
hadoop-env.sh

bashrc
配置HADOOP_HOME,SPARK_HOME,SCALA_HOME等信息

slaves


安裝Spark 1.6.0 略

Coarse Grained 
粗粒度,先配置資源。 細計算時分配
萬一有一個任務完成,其他資源閒着浪費。
Yarn: 粗粒度
MESOS 粗、細粒度


作業
安裝Hadoop, Spark環境截圖
發佈PI程序

--------------------------------------------------------------

王家林  中國Spark第一人
DT大數據夢工廠
新浪微博: http://weibo.com.ilovepains/
微信公共號:DT_Spark
博客:http://bolg.sina.com.cn/ilovepains
手機:18610086859
qq:1740415547
郵箱:[email protected]

--------------------------------------------------------------


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章