Python--大數據03

原創

2018-09-04 05:38

一、修改主機名和映射

1.切換root用戶,修改需要權限

2.修改主機名 vi /etc/hostname

保存退出

3.修改主機映射 vi /etc/hosts

保存退出

4.重啓

5.修改window下的映射

在桌面打開這個文件(記事本),輸入以下內容,記住一定輸入你配置的靜態ip,保存關閉

將桌面的文件拖到原來的文件夾中

選擇替換

以管理員繼續

完成

二、修改配置文件

1.重新連上linux

2.進入配置目錄

3.配置core-site.xml

在configuration添加以下內容然後保存退出

<property>

<name>fs.defaultFS</name>

<value>hdfs://python8:9000</value>

</property>

4.配置hdfs-site.xml

在configuration添加以下內容然後保存退出

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:///home/hadoop/opt/tmp/dfs/name</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:///home/hadoop/opt/tmp/dfs/data</value>

</property>

<property>

<name>dfs.namenode.http-address</name>

<value>python8:50070</value>

</property>

5.配置mapred-site.xml

查看當前目錄會發現沒有mapred-site.xml文件,只有一個mapred-site-xml.template的文件,我們複製一份命名爲mapred-site.xml

命令:cp mapred-site.xml.template mapred-site.xml

在configuration添加以下內容然後保存

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

6.配置yarn-site.xml

然後在configuration添加以下內容然後保存提出

<property>

<name>yarn.resourcemanager.hostname</name>

<value>python8</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

7.修改slaves

配置datanode的主機名稱爲python8

三、關閉防火牆和selinux

切換到root用戶

關閉防火牆

臨時關閉:systemctl stop firewlld

永久關閉:systemctl disable firewalld

查看狀態:systemctl ststus firewalld

關閉selinux

臨時關閉 seteforce 0

永久關閉 vi /etc/selinux/config

修改SELINUX=disabled

getenforce:查看狀態

切換到root用戶關閉防火牆

關閉selinux

重啓機器reboot

重新連接登錄hadoop

查看防火牆和selinux狀態

四、執行hdfs文件系統格式化:hdfs namenode -format

五、設置ssh無密碼登錄

輸入:ssh-keygen -t rsa 一直按回車

ssh-copy-id 你想登錄到的計算機名輸入hadoop密碼

六啓動服務 start-dfs.sh(如果沒有配置ssh無密碼登錄,那麼這裏會一直輸入密碼)

在這裏我輸入時遇到了報錯start-dfs.sh:未找到命令

解決辦法:

start-dfs的文件.sh存在於${HADOOP-HOME}/bin?如果沒有，請嘗試運行通用sbin/start-dfs.sh。

輸入命令:sbin/start-dfs.sh 即可

查看啓動的服務jps

start-yarn.sh及jps

七瀏覽服務器訪問,輸入python8:50070

成功顯示

八、文件上傳

1.創建一個目錄 hadoop fs -mkdir -p/user/hadoop

2.文件上傳

新建一個文件

寫入內容

保存退出

上傳

查看

七、Anaconda的安裝

1.上傳

2.安裝前需要安裝bzip2

(1)需要root用戶,切換用戶

(2)yum -y install bzip2安裝bzip2

命令:yum -y install bzip2

(3)退出root用戶

3.安裝Anaconda bash Anaconda3-5.0.1-Linux-x86_64.sh

(1)

(2)

(3)

(4)

(5)等待

(6)完成

4.更新變量環境

5.查看jupter地址jupyter-notebook --ip python8

進入網址後按ctrl+c退出

複製網址

注意:此處需要注意當你重啓虛擬機分別啓動所需要的6項服務後,然後輸入jupyter-notebook --ip命令後會顯示不出網址報錯

是因爲權限的問題,

解決辦法:重啓虛擬機直接用hadoop登錄切勿用root登錄,雖然我也不知道是什麼權限問題但是報錯沒有問題解決了

6.進瀏覽器,輸入你複製的網址

八、 sopark的安裝

1.上傳

2.解壓縮到opt目錄

命令 tar -xzf spark-2.2.1-bin-hadoop2.7tgz -C opt

3.配置環境變量

加入:export SPARK_HOME=/home/hadoop/opt/spark-2.2.1-bin-hadoop2.7

export PATH=$PATH:SPARK_HOME/bin:$SPARK_HOME/sbin

4.更新變量環境

5.測試是否成功

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

亂序拼圖驗證的識別並還原 puzzle-captcha（開源）

一、前言亂序拼圖驗證是一種較少見的驗證碼防禦，市面上更多的是拖動滑塊，被完美攻克的有不少，都在行爲軌跡上下足了功夫，本文不討論軌跡模擬範疇，就只針對拼圖還原進行研究。找一個市面比較普及的頂像亂序拼圖進行驗證，它號稱的防禦能力4星，

2021-12-01 00:53:28

智慧家庭場景的推薦系統的發展歷程和方向 | InfoQ《公開課》

直播概要：隨着計算機的蓬勃發展，互聯網進入大數據和人工智能時代，爲了解決信息過載和長尾商品，推薦系統成爲唯一選擇，而面對不同的業務場景，爲了解決業務痛點，會根據不同的場景特點尋找不同的方法和手段來解決推薦中實際遇到的問題。在智慧家庭領域，

InfoQ 中文站

2021-12-21 10:54:01

開源80萬行代碼，微衆銀行如何在小團隊規模下煉出一套一站式大數據平臺 | 卓越技術團隊訪談錄

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragr

2021-12-21 10:53:51

RocketMQ Streams：將輕量級實時計算引擎融合進消息系統

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-07 10:29:04

數據也需要滴血認親？

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"背景","attrs

2021-12-05 12:33:58

爲什麼Netflix“永不宕機”？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-25 15:48:52

RocketMQ 在金融企業技術中臺的落地實踐

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-25 10:53:56

數據讓您與衆不同

作爲數據分析領域的領導者，Google Cloud 一直致力於解決用戶最關注的問題，幫助用戶在數字化轉型的過程中更加有效的利用數據，最大化數據所帶來的價值，進而驅動業務的發展，包括打破數據孤島, 高效的實時和預測分析以及最大化數據洞察的應用

2021-11-23 11:18:54

開源雲原生數據編排軟件開發商Alluxio宣佈完成5000萬美元C輪融資

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-18 22:08:53

2021 GitHub年度報告：僅有 11% 的開發者想重返辦公室辦公；JavaScript依然最受歡迎

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-18 22:03:52

Databricks與Snowflake創始人開撕：“未來十年數據倉庫要麼不存在要麼大變樣”

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockq

2021-11-18 18:03:58

通過優化S3讀取來提高效率和減少運行時間

{"type":"doc","content":[{"type":"heading","attrs":{"align":null,"level":1},"content":[{"type":"text","text":"概述"}]},{"t

Bhalchandra Pandit

2021-11-11 10:23:52

基礎軟件創業 8 年，星環科技如何精準“踩點”？ | C位面對面

在大數據領域創業 12 年，眼見計算引擎經歷了數輪迭代，雲原生興起砸中了一批做容器的，數據雲因爲 Snowflake 上市走入大衆認知，回回都能在風口到來前兩三年做好佈局，這是一種什麼判斷和體驗？本期 C 位面對面，我們邀請到了星環科技創

InfoQ 中文站

2021-11-08 14:38:55

DataOps指南：數據管理新時代來了？

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-11-08 10:58:53

谷歌自研芯片Tensor正式亮相：5nm，8核CPU，支持手機運行AI模型

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-10-20 15:53:52

24小時熱門文章

最新文章

最新評論文章