Hadoop從入門到精通系列之--1.環境搭建

目錄

 

一 Hadoop簡介

二 Hadoop運行環境搭建前準備

2.1虛擬機準備

2.2網絡配置

2.3修改Linux主機名稱

三 Hadoop運行環境搭建

3.1 克隆虛擬機

3.2修改靜態ip

3.3修改主機名稱(見上)

3.4關閉防火牆

3.5創建用戶wanglei

3.6給wanglei配置root權限

3.7在/opt下新建software存放安裝包,module安裝軟件文件夾

四 安裝JDK和Hadoop

4.1使用xFtp傳輸jdk的tar包

4.2安裝Hadoop

4.3 總結:hadoop的環境配置是開始最難的一步,需要一定的Linux基礎,不然很難理解,我自己也是花了一個月時間將Linux學習了一遍,在配置的時候還是蠻順利的,這裏分享一下我的Linux學習視頻


一 Hadoop簡介

關於Hadoop,去百度上搜索能收到很多關於它的介紹,我用自己的話來介紹一下,Hadoop是Apache的一個項目,現在的社會已經步入了大數據時代,這個時代的特點就是數據量特別大,那麼就會遇到一個問題,數據量太大了,怎麼處理呢?Hadoop框架的作用就兩個:1.存儲 2.計算。存儲就是數據太大了,一臺電腦已經存儲不了了,那麼就需要好多臺電腦存數據,那麼這麼多電腦存,會遇到很多問題,比如怎麼存等等;計算就是比如我想統計一下阿里巴巴的日訪問量,阿里那麼大的訪問量怎麼統計求和呢?Hadoop就是爲了處理這樣的問題誕生的。

Hadoop的下載:hadoop官網:http://hadoop.apache.org/

點擊Download或者Getting   started均可,選擇對應的版本下載,建議hadoop2.x下載

二 Hadoop運行環境搭建前準備

2.1虛擬機準備

關於虛擬機的準備可以查看我在博客中Linux分類下的虛擬機和Linux安裝的部分,需要相關軟件的,鏈接:https://pan.baidu.com/s/1NuLTfrRmBNQlPq0bpsd9Ng 提取碼:qs2w,百度雲鏈接失效的可以發郵件到我的郵箱[email protected];我會及時補上。

https://blog.csdn.net/Haidaiya/article/details/81005032

2.2網絡配置

網絡配置的作用是設置服務器的靜態ip,並且使得我們Linux系統可以上網,具體步驟如下圖所示

  1. 命令行模式下輸入vim /etc/sysconfig/network-scripts/ifcfg-eth0
  2. 按照修改紅色方框中的內容修改

2.3修改Linux主機名稱

修改Linux主機的名稱是爲了讓我們在訪問服務器的時候更加方便一點,比如說訪問baidu時,我們更傾向於訪問www.baidu.com,而不是它的IP地址。

修改的步驟如下:

  1. hostname查看當前的名稱
  2. vim /etc/sysconfig/network修改主機名稱
  3. 將主機名稱修改爲hadoop101,其實這個名稱隨意起
  4. vim /etc/sysconfig/network,修改主機名稱到IP地址的映射
  5. 上一部分,設置的ip地址和這裏的主機名稱對應起來,這樣以後訪問這個服務器就不要輸入ip地址了,直接輸入hadoop101就可以訪問了。

如有需要也可以在windows下添加映射,這樣可以ping通主機名稱

三 Hadoop運行環境搭建

3.1 克隆虛擬機

右鍵虛擬機,管理,克隆

3.2修改靜態ip

針對克隆過來的虛擬機

  1. 因爲虛擬機是直接複製前面一步安裝的,所以對於它的網卡部分需要修改
  2. 註釋下圖中的那行,複製物理網卡地址,修改NAME爲eth0

配置網絡

將上一部中複製的網卡地址複製到下圖的位置

3.3修改主機名稱(見上)

見2.3

3.4關閉防火牆

service   iptables stop

3.5創建用戶wanglei

創建用戶useradd    wanglei

指定密碼passwd     wanglei

3.6給wanglei配置root權限

給普通用戶wanglei配置root權限是爲了方便一些操作,因爲有些文件夾普通用戶打不開。

如果發現這個下圖中的文件是隻讀文件,就是用chmod  744   sudoers命令修改一下,即可編輯這個文件,在文件中添加紅色框中的命令。


3.7在/opt下新建software存放安裝包,module安裝軟件文件夾

sudo   mkdir  software

sudo   mkdir  module

四 安裝JDK和Hadoop

4.1使用xFtp傳輸jdk的tar包

這裏解釋一下爲什麼要安裝JDK,因爲Hadoop框架是用java寫的,沒錯就是這樣,使用Xftp工具將jdk-8u144-linux-x64.tar.gz傳輸到Linux服務器上的softwar目錄,並且將壓縮包解壓到module目錄下,命令如下:tar    -zxvf    jdk-8u144-linux-x64.tar.gz     -C      /opt/module/

配置環境變量,輸入vim    /etc/profile  ,  添加兩行

export   JAVA_HOME=/opt/module/jdk1.8.0_144

export   PATH=$PATH:$JAVA_HOME/bin

4.2安裝Hadoop

步驟與jdk的安裝步驟相同,環境變量的配置不同

輸入hadoop可以順利看到這些信息說明hadoop的環境已經基本搭建好了,這裏講的很詳細了,但是如果沒有Linux基礎的話可能還是看的雲裏霧裏,需要提前看一下Linux基礎

4.3 總結:hadoop的環境配置是開始最難的一步,需要一定的Linux基礎,不然很難理解,我自己也是花了一個月時間將Linux學習了一遍,在配置的時候還是蠻順利的,這裏分享一下我的Linux學習視頻

https://www.bilibili.com/video/av31902291/?p=1

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章