大數據面試100題

1.列出安裝Hadoop流程步驟

a) 創建hadoop賬號

b) 更改ip

c) 安裝Java 更改/etc/profile 配置環境變量

d) 修改host文件域名

e) 安裝ssh 配置無密碼登錄

f) 解壓hadoop

g) 配置hadoop  conf下面的配置文件

h) Hadoop namenode -format  格式化

i) Start 啓動

2.列出hadoop集羣啓動中的所有進程和進程的作用

a) Namenode 管理集羣  記錄namenode文件信息

b) Secondname 可以做備份  對一定範圍內的數據做快照

c) Datanode  存儲數據

d) Jobtarcker 管理任務  分配任務

e) Tasktracker   執行任務

3.啓動報nameNode錯誤 如何解決

a) 檢查hdfs有沒有啓動成功

b) 檢查輸入文件是不是存在

4.寫出下列執行命令 

殺死一個job

Hadoop job -list  取得job id

Hadoop job kill job id

刪除hdfs上的 /temp/aa 目錄

Hadoop -daemonSh start datanode 

加入一個新的節點或刪除一個節點  刷新集羣狀態的命令


5.列出你所知道的調肚臍  說明其工作方法

a) Fifo schedular 默認的調肚臍  先進先出

b) Capacity schedular  計算能力調肚臍  選擇佔用內存小  優先級高的

c) Fair schedular 調肚臍  公平調肚臍  所有job 佔用相同資源

6.列出開發map/reduce 元數據存儲

a) 

7.用你最熟悉的語言辨析一個map reduce 計算第四個原色的個數

a) Wordcount  

8.你認爲java streating pipe 開發map reduce 優缺點

a) Java 編寫map reduce可以實現複雜的邏輯  如果需求簡單  則顯得繁瑣

b) Hivesql 基本都是針對Hive中表數據進行編寫  對複雜的邏輯很難實現




發佈了146 篇原創文章 · 獲贊 21 · 訪問量 18萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章