大数据(一)--------环境搭建

原創

2020-06-20 16:47

一、安装虚拟机及Linux

虚拟机我装的VMware14，Linux我装的CentOS8，具体安装的过程网上教程很多，我就不再赘述了，装的过程中遇到的问题我都汇总在了另一篇文章中”大数据学习遇到的那些坑“。

能到上图所示的时候就说明虚拟机以及Linux系统已经安装好了。

二、让虚拟机能够联网

1、虚拟机设置固定IP

将虚拟机设置成固定ip的好处在于每次使用它的ip都是固定的，方便，而且有时候电脑连无线的时候ip回经常变化，而且家里的网和公司的网ip不一样，如果不设置成固定ip的话每次都需要手动去执行读取文件统一ip的操作，不是方便。

设置方法：打开VMware并保证里面的系统都处于关闭状态；然后点击“编辑 ----> 虚拟网络编辑器”

按图示步骤依次点击进行设置。比如我这里想设置的ip是“192.168.1.***”，所以编号为3的地方需要设置为 192.168.1.0，编号4的地方需要设置为如下：只需修改所示位置即可

编号5的位置设置如下：所示位置前三个网段保持一致，最后一个是一个范围，可设置在0-255之间，需要注意的是你之后打算用的IP需要在这个范围之内；比如我之后打算用 192.168.1.112，因此我这设置的范围就是 110-254 。

2、windows网络设置

找到下图所示的东西，右键” 属性“；

打开之后双击 ipv4

使用gudingip并作如下设置

3、关闭防火墙

进入虚拟机后打开centOS系统并登录，进行如下操作：

查看防火墙：systemctl status firewalld.service

关闭防火墙：systemctl stop firewalld.service

禁用防火墙：systemctl disable firewalld.service

4、修改selinux

用命令打开该文件： vi /etc/selinux/config

将 SELINUX=enforcing 改为 SELINUX=disabled

5、修改IP

使用如下命令打开文件进行修改配置：

vi /etc/sysconfig/network-scripts/ifcfg-ens33 用tab键自动补全，因为最后带颜色的部分不同电脑可能会不太一样

修改以下几项：带颜色的表示修改或增加

BOOTPROTO=static

ONBOOT=yes

IPADDR=192.168.1.111

GATEWAY=192.168.1.2

DNS1=8.8.8.8

DNS2=8.8.4.4

NETMASK=255.255.255.0

使用命令打开文件：vi /etc/resolv.conf

nameserver 8.8.8.8

nameserver 8.8.4.4

6、重启网络

service network restart

CentOS7及之前是这个命令，之后的版本命令有所变化。

上面的操作全部做完之后就可以检查能否连上网了。

检测能否连外网：ping www.baidu.com

检查能否连本机：ping 192.168.1.2

出现如下图所示的状态表示虚拟机系统可以联网了。

7、IP与主机名进行映射

使用命令： vi /etc/hosts 打开文件，添加下面的设置

192.168.1.111 bigdata111

192.168.1.112 bigdata112

192.168.1.113 bigdata113

再在 windows 的 C:\Windows\System32\drivers\etc 路径下找到 hosts 并添加

192.168.1.111 bigdata111

192.168.1.112 bigdata112

192.168.1.113 bigdata113

做这个映射的目的在于将主机名字和唯一IP进行绑定，之后就可以使用主机名更方便的代替IP进行操作。

三、用Xshell连接虚拟机

首先点击图标新建连接

在输入连接的主机ip，之后点击”用户身份验证

输入用户名和密码后点击“确定”开始连接；

然后出现的弹出框点击“保存并接受”就可以了，连接上之后状态如下：

四、安装并配置JDK及hadoop

先查询是否有java，使用命令 rpm -qa|grep java查看，如果有就不用安装，如果不想要需要卸载可以使用命令 rpm -e 软件包名字；我这没有需要安装。

首先在Linux系统的 /opt目录下新建两个文件夹，module作为安装路径，software作为安装包路径

然后点击Xshell里面的文件传输，将左边windows里面的文件传输到右边Linux对应的目录下

传了两个安装包，一个是java的jdk，一个是hadoop，注意两个都要是Linux系统的。之后使用命令将安装包解压到module目录下： tar -zxvf jdk-8u144-linux-x64.tar.gz -C /opt/module/，hadoop的解压方式相同

环境变量的配置

解压完之后进入到对应的目录之下配置环境变量。首先到对应的目录下找到JDK和HADOOP的绝对路径，如图：

然后执行命令 vi /etc/profile 打开该文件，在最后添加环境变量：

export JAVA_HOME=/opt/module/jdk1.8.0_144

export PATH=$PATH:$JAVA_HOME/bin

export HADOOP_HOME=/opt/module/hadoop-2.8.4

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

添加并保存后，执行命令 source /etc/profile 使刚才的配置被激活

验证是否配置成功

执行命令 javac，能看到很多java相关信息；再执行命令 java -version能看到java的版本信息则说明JDK配置成功。

start-dfs.sh，不执行该命令，但是用 tab 键能够补全该命令则说明 HADOOP 配置成功。

再执行命令 jps 查看进程，看到有进程在运行。

至此，基本的 LINUX 环境已经搭建好，而且装好了 java 和 hadoop，接下来就可以搭建伪分布式和完全分布式了。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

大数据(一)--------环境搭建

一、安装虚拟机及Linux

二、让虚拟机能够联网

1、虚拟机设置固定IP

2、windows网络设置

3、关闭防火墙

4、修改selinux

5、修改IP

6、重启网络

三、用Xshell连接虚拟机

四、安装并配置JDK及hadoop

环境变量的配置

验证是否配置成功

使用c#强大的表达式树实现对象的深克隆之解决循环引用的问题

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU启动那些事（12.A）- uSDHC eMMC启动时间(RT1170)

GPT-4o 引领人机交互新风向，向量数据库赛道沸腾了

本地SSL证书过期输入命令在IIS自动生成

.NET周刊【5月第2期 2024-05-12】

大數據(一)--------環境搭建

Failed to load class "org.slf4j.impl.StaticLoggerBinder" spark

jupyter將默認路徑更換爲自定義路徑

大數據(二)--------僞分佈式

Linux相關

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結