hadoop集群配置

1.软件版本

软件 版本
vmware 12
centos 6.1
jdk 1.8.0_191_64bit
hadoop 2.7.4

1.1.虚拟机安装

虚拟机主要是搞清楚网络配置。

2.linux配置

linux相关配置主要有3类:

  1. 名称与IP映射
  2. ssh免密码登录
  3. 关闭防火墙

1)查看ip信息
#ifconfig
2)修改网络配置文件,ip获取方式静态
vim /etc/sysconfig/network-scripts/ifcfg-eth0
linux里的bootproto的none,static,dhcp有什么区别:static静态ip、dhcp动态ip。
3)重启网络服务
service network restart
4)修改主机名
vim /etc/sysconfig/network
修改会话级别的主机名
# hostname master

1)hosts映射,验证可否ping通
#vim /etc/hosts
2)ssh免密码登陆
原理:
源主机A、目标主B,A希望免密码登陆B。
A生成秘钥对,把公钥分发给B(接了我的公钥,就允许我的访问了;不要,可以不接)
B对A的公钥进行授权访问
原理:
1)授权访问:通过B对A的公钥的授权访问,即允许A对B访问了。
2)身份鉴别:怎么保证是A在访问呢?秘钥。秘钥是A自己掌握的。
3)登陆过程:
A发送公钥到B
B鉴别A发送的公钥与已掌握的公钥是否一致(在访问列表了)
一致,用A公钥加密一段消息,返回给A
A用秘钥解密,返回给B
B比较消息是否一致,一致,则认可A的身份
允许登陆
核心问题有2个:
1)授权访问:通过把A的公钥加入B的授权文件实现。
2)身份识别:通过A的秘钥实现。
操作:3个节点分别生成公钥、秘钥;把公钥加入到授权文件;节点分别对其他2个基点授权(可通过授权文件分发实现)
1)各节点生成公钥秘钥对
# ssh-keygen -t rsa
默认在~/.ssh下,生成2个文件id_rsa和id_rsa.pub
2)把公钥集中到1个节点
# scp ~/.ssh/id_rsa.pub root@Nodeb:~/.ssh/
3)加入到授权列表,文本追加的形式
# cat id_rsa.pub>>~/.ssh/authorized_keys
4)分发访问授权名单
5)注意:authorized_keys权限是600,只能属主可以修改;否则,任意用户恶意追加授权,门户大开!
如果权限不对,authorized_keys文件是不起作用的。
3)防火墙、selinux
–查看se状态
#sestatus
–永久关闭
# vi /etc/sysconfig/selinux
SELINUX=disabled
4)jdk
配置环境变量
# vim /etc/profile
export JAVA_HOME=
export PATH=JAVAHOME/bin:JAVA_HOME/bin:PATH
export CLASS_PATH=.:JAVAHOME/lib/dt.jar:JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar
# source /etc/profile

3.hdp

1)创建用户

		# adduser hadoop
		# passwd hadoop
		# usermod -a -G hadoop hadoop 
		# vim /etc/sudoers

2)安装hdp软件
1.解压
2.环境变量
#vim /etc/profile
export HADOOP_HOME=
export PATH=PATH:PATH:HADOOP_HOME/bin:$HADOOP_HOME/sbin
3)修改配置文件:7个,4+2+1
4个:xml配置文件,同伪分布式
2个:env,java环境变量
1个:slaves,节点清单,伪分布式不需要,因为只有1个节点。
4)分发hdp文件
5)格式化


6)启动、检查


问题

–nat网络配置?虚拟机ip随便设吗?dns?

&:nat模式下,网络有3个功能模块:
1)vmware的网络编辑器:可认为是路由器。设置nat网络的网段、网关
2)虚拟网卡:是宿主的网卡,用来接入nat网络;故ip要在nat的网段、网关与nat的一致;
3)虚拟机网络:要求同宿主的虚拟网卡一样,ip要在nat网段、网关与nat的一致。
ps:虚拟机访问internet,通过nat网络路由器实现;所以,禁止虚拟网卡,不影响虚拟机访问外网。

--子网?子网掩码原理?
&:子网掩码是连续1、0的32位的标识为。前段是若干位连续的1,标识网段;后段是连续的0,表示子网容量。
   eg:子网掩码,255.255.255.0,切换成二进制为11111111.11111111.11111111.00000000,后段0有8位,表示子网容量2^8=256;前段1有24位,则前ip地址的前24位是不同网段。eg:192.168.1.10,192.168.1.110根据子网掩码计算,子网标记是192.168.1.0,是同一个子网的,可以相互直接访问。
       子网掩码,255.255.255.192,切换成二进制为11111111.11111111.11111111.11000000,后段0有6位,表示子网容量2^6=64;前段1有26位,则192.168.1.10(00001010),192.168.1.100(1100100),则不再是1个网段。

虚拟机怎么复制?

--authentification、authorization
&:authentification:你是谁?
   authorization:你可以做什么?(author,创作者?创作者可以做什么呢?或者说创作者已经完成了身份认证了)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章