1.列出安裝Hadoop流程步驟
a) 創建hadoop賬號
b) 更改ip
c) 安裝Java 更改/etc/profile 配置環境變量
d) 修改host文件域名
e) 安裝ssh 配置無密碼登錄
f) 解壓hadoop
g) 配置hadoop conf下面的配置文件
h) Hadoop namenode -format 格式化
i) Start 啓動
2.列出hadoop集羣啓動中的所有進程和進程的作用
a) Namenode 管理集羣 記錄namenode文件信息
b) Secondname 可以做備份 對一定範圍內的數據做快照
c) Datanode 存儲數據
d) Jobtarcker 管理任務 分配任務
e) Tasktracker 執行任務
3.啓動報nameNode錯誤 如何解決
a) 檢查hdfs有沒有啓動成功
b) 檢查輸入文件是不是存在
4.寫出下列執行命令
殺死一個job
Hadoop job -list 取得job id
Hadoop job kill job id
刪除hdfs上的 /temp/aa 目錄
Hadoop -daemon。Sh start datanode
加入一個新的節點或刪除一個節點 刷新集羣狀態的命令
5.列出你所知道的調肚臍 說明其工作方法
a) Fifo schedular 默認的調肚臍 先進先出
b) Capacity schedular 計算能力調肚臍 選擇佔用內存小 優先級高的
c) Fair schedular 調肚臍 公平調肚臍 所有job 佔用相同資源
6.列出開發map/reduce 元數據存儲
a)
7.用你最熟悉的語言辨析一個map reduce 計算第四個原色的個數
a) Wordcount
8.你認爲java streating pipe 開發map reduce 優缺點
a) Java 編寫map reduce可以實現複雜的邏輯 如果需求簡單 則顯得繁瑣
b) Hivesql 基本都是針對Hive中表數據進行編寫 對複雜的邏輯很難實現