大数据入门(2)——学习实战路线

原文发表于我的个人网站:https://www.imhou.com/%e5%a4%a7%e6%95%b0%e6%8d%ae%e5%85%a5%e9%97%a82-%e5%ad%a6%e4%b9%a0%e5%ae%9e%e6%88%98%e8%b7%af%e7%ba%bf/

大数据的计算模型分为:离线计算和实时计算。

1. 首先学习编程语言

  • Java –> Java SE 的内容,Java 基础
  • Scala –> 学习Spark,注意:Scala是基于Java的,需要JVM环境

2. 需要学习Hadoop:

  • 数据的存储:HDFS——Hadoop Distributed File System
  • 数据的计算:MapReduce
  • 生态圈(组件):HBase、Hive、Flume、Pig、HUE、Sqoop等等

3. NoSQL 数据库:Redis 内存数据库

4. 学习Apache Storm 实时计算

5. Spark

  • Scala
  • Spark Core 内核(处理引擎)
  • Spark SQL:类似MySQL数据库,支持SQL
  • Spark Streaming: 类似Apache Storm 实时计算

6. 将来:机器学习、深度计算、人工智能

注意:大数据和关系型数据库有什么关系?没有关系!!!

学习大数据的时候,重点要:

  • 掌握原理和体系结构
  • 动手实验
  • 写程序
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章