其實,直接安裝也很簡單,官方說明文檔:http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/SingleCluster.html。使用Docker安裝只是爲了不想污染我的雲服務器...
首先確保你的機器關了防火牆(或者安裝完後開啓指定端口的白名單),然後就是已經有了Docker,還沒安裝的可以參考我的另一篇博客。
1、下載鏡像
docker pull sequenceiq/hadoop-docker:2.6.0
你也可以選擇latest,目前是2.7.0。
2、運行,並指定端口映射
docker run -i -t -p 50070:50070 -p 9000:9000 -p 8088:8088 -p 8040:8040 -p 8042:8042 -p 49707:49707 -p 50010:50010 -p 50075:50075 -p 50090:50090 sequenceiq/hadoop-docker:2.6.0 /etc/bootstrap.sh -bash
至於哪個端口表示什麼,50070是namenode的頁面(主頁面),50075是datanode的頁面,50090是status的頁面,9000是客戶端使用hdfs協議連接的端口,其它的不太清楚。
3、查看容器是否啓動
docker ps
4、進入容器內部
docker exec -it ${CONTAINER ID} /bin/bash
這樣你就可以像普通安裝的那樣操作了。比如說,使用它提供的jar包跑一下MapReduce案例。或者,你也可以直接打開瀏覽器進行驗證:輸入http://宿主機ip:50070,看下是否能夠訪問namenode的頁面。