hadoop：分佈式集羣參數master節點的配置！

原創

CDA·数据分析师

2020-05-27 18:11

之前的文章中我們已經將master節點的網絡IP、hostname文件、hosts文件配置完成，接下來還有hadoop相關配置文件需要修改。今天我們來講master節點hadoop的配置。

1、hdfs-site.xml

在hadoop的配置文件中與HDFS(hadoop分佈式文件系統)相關的是hdfs-core.xml文件。在僞分佈集羣中只有一個節點，因此此節點即要有NameNode功能也要有DataNode功能。在工作環境中這兩個是不會在一個節點上的，在我們的多節點分佈式集羣中master只運行NameNode因此需在hdfs-site.xml文件中刪除DataNode相關配置。

打開虛擬機在終端中輸入cd hadoop/etc/hadoop 命令進入hadoop配置文件目錄。

終端輸入命令vim hdfs-site.xml進入vim編輯界面，按下圖步驟刪除原來僞分佈集羣配置的DataNode相關配置，並將數據冗餘數量設置爲2。

輸入i進入編輯模式，編輯後的文件內容如下所示。

最後退出編輯模式，保存並退出。

2、core-site.xml

在core-site.xml中指定一個節點運行hdfs服務。在之前僞分佈集羣中只有一個節點，因此我們使用的是localhost,如今在集羣中有三個節點，我們約定使用master。

在終端中輸入vim core-site.xml按下圖操作修改配置文件。

修改後內容如下所示

記得退出並保存。

3、yarn-site.xml

在yarn-site.xml裏可以修改與資源管理模塊YARN相關的一些配置。

終端中輸入 vim yarn-site.xml進行以下更改，將資源調度管理任務放置於master節點上

最終修改後的文件內容如下圖所示。

4、mapred-site.xml

進行以下更改，主要添加mapreduce運行歷史記錄監控端口和網頁端口。

同樣，在終端輸入vim mapred-site.xml開始編輯配置文件，配置內容如下所示

最後保存並退出。

5、slaves

slaves文件指明哪些節點運行DateNode進程，這裏我們的集羣中運行DataNode進程的節點有slave1、slave2。因此需將這兩節點保存到slaves文件中。

在終端中輸入 vim slaves命令編輯文件，編輯後的文件內容如下圖所示。

最後保存slaves文件並退出編輯。到這裏master節點上的hadoop相關配置已經完成了。

接下來我們要通過克隆master及slave1虛擬機來擴展集羣。

6、生成slave1節點

通過克隆master 生成slave1節點的過程與之前克隆僞分佈節點的操作是一致的這裏不再贅述，唯一區別是在執行到下圖步驟時注意將虛擬機名稱設置爲slave1並選擇正確的存儲位置方便管理。還有一點，被克隆的虛擬機一定要關機狀態纔可以被克隆。

slave1節點與master節點在hostname、IP地址、Hadoop配置這幾個方面是有些差異的，在複製好slave1節點之後需進行配置。

6.1 配置IP地址

在前面文章中提到過slave1節點IP地址應設置爲固定的值：192.168.79.12。詳細的配置方法步驟已經在配置master節點時介紹過，配置slave1節點時可以參考一下。修改完成後的配置結果如下圖所示，點擊save保存即可。

6.2、修改hostname

保存並退出

6.3、修改Hadoop配置項

hdfs-site.xml

保存並退出之後重啓slave1節點查看配置是否生效。

7、生成slave2節點

Slave2與slave1在Hadoop相關配置內容上是一致的，因此通過克隆slave1節點來生成slave2可以減少一些操作步驟。

克隆slave1節點時的操作步驟同樣參考之前文章內容，區別是執行到下圖步驟時記得更改虛擬機名稱爲slave2並更改存儲目錄（存儲目錄自己定義）。

7.1、配置IP地址

克隆完成後打開slave2虛擬機並配置其IP地址。配置過程與之前配置master節點IP過程一致，只是IP地址需改爲192.168.79.13結果如下圖所示，點擊save保存即可。

更改Hostname，在終端中輸入sudo vim /etc/hostname並回車執行，根據提示輸入密碼

輸入i編輯hostname文件，文件內容如下所示爲slave2，然後保存退出。

重啓虛擬機測試配置是否生效，重啓命令爲sudo reboot

slave2重新啓動後打開終端，輸入命令ifconfig查看IP設置及虛擬機名，如下圖所示配置已經生效。

到這裏我們的hadoop集羣安裝配置完成。接下來的文章我會給大家介紹一下hadoop集羣如如何啓動。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Hive引擎底層初探

1、什麼是Hive Hive是一個基於Hadoop的數據倉庫工具,用於處理和分析大規模結構化數據。Hive提供了類似SQL的查詢語言(HiveQL)，使得熟悉SQL的用戶能夠查詢數據。Hive將SQL查詢轉換爲MapReduce任務，以在

2024-04-17 11:18:21

用海豚調度器定時調度從Kafka到HDFS的kettle任務腳本

在實際項目中，從Kafka到HDFS的數據是每天自動生成一個文件，按日期區分。而且Kafka在不斷生產數據，因此看看kettle是不是需要時刻運行？能不能按照每日自動生成數據文件？爲了測試實際項目中的海豚定時調度從Kafka到HDFS的K

2024-04-15 21:18:44

WhaleScheduler爲銀行業全信創環境打造統一調度管理平臺解決方案

項目背景數字金融是數字經濟的重要支撐和驅動力。近年來，我國針對數字金融的發展政策頻頻出臺，《金融科技發展規劃（2022-2025年）》、《“十四五”數字經濟發展規劃》、《關於銀行業保險業數字化轉型的指導意見》、《金融標準化“十四五”

2024-04-19 21:18:25

用戶行爲分析模型實踐（四）—— 留存分析模型

作者：vivo 互聯網大數據團隊- Wu Yonggang、Li Xiong 本文是vivo互聯網大數據團隊《用戶行爲分析模型實踐》系列文章第4篇 -留存分析模型。本文詳細介紹了留存分析模型的概念及基本原理，並

2024-04-19 11:26:00

京東內部研效架構師訓練營，首次對外公開課，不可錯過的研效之旅！

五月繁花似錦，讓我們帶你走進京東，開啓研效實戰之旅！四大單位聯合發起本次活動由“全國雲計算技術行業產教融合共同體”發起，聯合工業和信息化部電子第五研究所、E³CI軟件研發效能度量工作委員會、京東雲共同主辦，重磅推出“卓越研效架構師”

京東雲開發者

2024-04-19 11:16:30

軟件測試從自動化到智能化，大模型開始加入

隨着科技的飛速發展，軟件行業也在不斷地演進和創新。作爲軟件行業的關鍵環節之一，軟件測試行業也在經歷着前所未有的變革。從最初的手動測試，到自動化測試，再到如今的智能化測試，軟件測試行業正在經歷一場深刻的技術革命。在這場革命中，Testin雲測

2024-04-19 00:53:25

GaussDB(DWS)基於Flink的實時數倉構建

本文分享自華爲雲社區《GaussDB(DWS)基於Flink的實時數倉構建》，作者：胡辣湯。大數據時代，廠商對實時數據分析的訴求越來越強烈，數據分析時效從T+1時效趨向於T+0時效，爲了給客戶提供極速分析查詢能力，華爲雲數倉GaussDB

2024-04-18 10:32:57

這篇 DolphinScheduler on k8s 雲原生部署實踐，值得所有大數據人看！

在當前快速發展的技術格局中，企業尋求創新解決方案來簡化運營並提高效率成爲一種趨勢。 Apache DolphinScheduler作爲一個強大的工具，允許跨分佈式系統進行復雜的工作流任務調度。本文將深入探討如何將Apache Dolphin

2024-04-17 21:18:15

五一假期暢遊指南：Python技術構建的熱門景點分析系統解讀

導言五一假期即將到來，作爲一名熱愛旅遊的技術達人，我總是希望能夠通過技術手段更好地規劃我的旅行路線。在這篇文章中，我將向大家介紹一款基於Python技術的熱門景點分析系統，幫助您在五一假期中游玩得更加盡興！ 1. 系統概述熱門景點

2024-04-16 23:25:46

裁員了！別錯過2024年大數據工程師必備的10項技能

在當今快速發展的世界中，數據被視爲新的石油。隨着對數據驅動洞察的日益依賴，大數據工程師的角色比以往任何時候都更爲關鍵。這些專業人員在管理和優化組織內的數據操作中扮演着至關重要的角色。在本文中，我們將探索2024年大數據工程師必須具備的十

2024-04-16 11:00:53

萬字長文，聊聊我在錦禮成長的這一年

”學而不思則罔,思而不學則殆“，本文記錄了作者在錦禮側工作1年間遇到的思考與成長、挑戰與困難，也是對過去工作的總結與反思，分享出來，希望對大家有所幫助。本文約10000字如果覺得頁面很長那是因爲截圖和留言很多，哈哈 00引言光

2024-04-15 11:16:26

RAG應用開發實戰02-相似性檢索的關鍵 - Embedding

1 文本Embedding 將整個文本轉化爲實數向量的技術。 Embedding優點是可將離散的詞語或句子轉化爲連續的向量，就可用數學方法來處理詞語或句子，捕捉到文本的語義信息，文本和文本的關係信息。 ◉ 優質的Embedding通常會讓語

2024-04-15 01:07:41

JSON Stream

1. 需求背景在日常開發中經常會遇到大對象或者大文件處理, 比如在nodejs開發中, 一個算法包可能範圍了一個長度爲好幾萬長度的一個對象, 這個對象使用Restful API不好傳遞, 肯定會把這個處理結果保存爲文件, 然後通過通過文件

2024-04-12 23:17:15

CANXL標準發佈 | (1)一文讀懂CANXL數據鏈路層總線，通信再進化！

2024年3月22日，期待已久的ISO 11898-2：2024版本橫空出世，標誌着新一代CAN總線的時代即將到來（ISO/FDIS 11898-1：2023也處於最終投票階段）。搭載着2048Byte的CANXL列車已蓄勢

2024-04-12 22:42:22

RAG應用開發實戰(01)-RAG應用框架和解析器

1 開源解析和拆分文檔第三方的工具去對文件解析拆分，去將我們的文件內容給提取出來，並將我們的文檔內容去拆分成一個小的chunk。常見的PDF word mark down, JSON、HTML。都可以有很好的一些模塊去把這些文件去進行一個

2024-04-12 01:06:38

24小時熱門文章

最新文章

最新評論文章