DT大数据梦工厂- 第6课精通Spark集群搭建与测试

原創

chinsun_1

2018-08-31 14:25

20160106 课程笔记

Spark上流行的存储框架： Hadoop的 HDFS 和 S3 云存储

未来三至五年黄金组合框架：Spark+Tachyon+HDFS

Tachyon: 基于内存的分布式文件系统, 不同来源的数据,

安装

VMWare 软件

电脑推荐16G: 两个 KINGSTON 8G，至少8G内存

系统推荐UbantuKylin

SecureCRT 工具

使用Hadoop 2.6.0 目前而言，最稳定的版本

Hadoop重要目录

/usr/local/hadoop/

-2.6.0/

core-site.xml

hdfs-site.xml

mapred-site.xml

yarn-site.xml

hadoop-env.sh

bashrc

配置HADOOP_HOME,SPARK_HOME,SCALA_HOME等信息

slaves

安装Spark 1.6.0 略

Coarse Grained

粗粒度，先配置资源。细计算时分配

万一有一个任务完成，其他资源闲着浪费。

Yarn：粗粒度

MESOS 粗、细粒度

作业

安装Hadoop, Spark环境截图

发布PI程序

--------------------------------------------------------------

王家林中国Spark第一人
DT大数据梦工厂
新浪微博： http://weibo.com.ilovepains/
微信公共号：DT_Spark
博客：http://bolg.sina.com.cn/ilovepains
手机：18610086859
qq：1740415547
邮箱：[email protected]

--------------------------------------------------------------

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

DT大数据梦工厂- 第6课精通Spark集群搭建与测试

Android启动过程-万字长文(Android14)

【SQL进阶】CASE语句的使用

这种嵌套字典类型的数据，我想把它读取到df里，如何操作？

微调真的能让LLM学到新东西吗:引入新知识可能让模型产生更多的幻觉

iNeuOS工业互联网操作系统，增加电力IEC104协议

微服务实践k8s&dapr开发部署实验（3）订阅发布

kbgressdb之数据结构V0.2

DT大數據夢工廠- 第6課精通Spark集羣搭建與測試

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

DT大数据梦工厂- 第6课 精通Spark集群搭建与测试

DT大数据梦工厂- 第6课精通Spark集群搭建与测试