Hadoop的基础运行模式

主从架构

  • Master:主节点运行NameNode、ResourceMananger服务进程
  • Slave:从节点,运行DataNode、NodeManager服务进程
主要的服务进程详解
  • NameNode,负责记录数据是存在哪个存储空间的,与DataNode通信,通过算法决策将数据分发到节点进行存储
  • DataNode,负责实际数据的存储,反馈所在节点的状态信息给NameNode
  • 一个HDFS集群包含一个单独的Master节点和多个Slave节点,这里所说的单独的Master节点并不是一个机器或服务器,而是指的逻辑意义上的一个Master组件,它具体可以是1或2台物理服务器,而Slave节点就是指的Slave服务器。可以这么说,由一台Master服务器所架设的NameNode,称之为单NameNode集群,两台Master服务器架设成的NameNode,称之为双NameNode集群,通常,所有的这些机器、或服务器都是普通的Linux机器,在这些Linux服务器上运行着用户级别(user-level)的服务进程。

3种Hadoop运行模式:单机模式、伪分布式模式、分布式模式

  1. 单机模式:用于实验,所有服务进程运行在同一台机器上,非分布式文件系统,文件系统直接采用本地文件系统,直接读写本地文件,无论存储和计算都由单机完成。
  2. 伪分布式:通过一台机器上不同的Java进程来模拟分布式种不同节点上的服务进程,将文件系统设置程分布式的文件系统,即便是一台机器,也可以看成是逻辑上的分布式。例如:可以在同一台机器上运行NameNode、DataNode,即此机器既管理存储空间实际存储数据;运行ResourceManager、NodeManager,即此机器既负责资源调度也负责
    作业调度
  3. 分布式:就是将伪分布式种运行的一些服务进程放到另外一些机器上运行,例如:把DataNode和NodeManager放到多个从节点上运行,就实现了真正的分布式模式的Hadoop集群
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章