hadoop2.x常用端口、定義方法及默認端口、hadoop1.X端口對比

問題導讀:
1.DataNode的http服務的端口、ipc服務的端口分別是哪個?
2.NameNode的http服務的端口、ipc服務的端口分別是哪個?
3.journalnode的http服務的端口、ipc服務的端口分別是哪個?
4.ResourceManager的http服務端口是哪個?
5.NodeManager的http服務端口是哪個?
6.Master的http服務的端口、ipc服務的端口分別是哪個?
7.3888是誰的端口,用來做什麼?
擴展:
hadoop1.X對應端口是哪個?
9000、9001分別對應是hadoop2.X的那個端口?

Hadoop集羣的各部分一般都會使用到多個端口,有些是daemon之間進行交互之用,有些是用於RPC訪問以及HTTP訪問。而隨着Hadoop周邊組件的增多,完全記不住哪個端口對應哪個應用,特收集記錄如此,以便查詢。
這裏包含我們使用到的組件:HDFS, YARN, HBase, Hive, ZooKeeper:
組件 節點 默認端口 配置 用途說明
HDFS DataNode 50010 dfs.datanode.address datanode服務端口,用於數據傳輸
HDFS DataNode 50075 dfs.datanode.http.address http服務的端口
HDFS DataNode 50475 dfs.datanode.https.address https服務的端口
HDFS DataNode 50020 dfs.datanode.ipc.address ipc服務的端口
HDFS NameNode 50070 dfs.namenode.http-address http服務的端口
HDFS NameNode 50470 dfs.namenode.https-address https服務的端口
HDFS NameNode 8020 fs.defaultFS 接收Client連接的RPC端口,用於獲取文件系統metadata信息。
HDFS journalnode 8485 dfs.journalnode.rpc-address RPC服務
HDFS journalnode 8480 dfs.journalnode.http-address HTTP服務
HDFS ZKFC 8019 dfs.ha.zkfc.port ZooKeeper FailoverController,用於NN HA
YARN ResourceManager 8032 yarn.resourcemanager.address RM的applications manager(ASM)端口
YARN ResourceManager 8030 yarn.resourcemanager.scheduler.address scheduler組件的IPC端口
YARN ResourceManager 8031 yarn.resourcemanager.resource-tracker.address IPC
YARN ResourceManager 8033 yarn.resourcemanager.admin.address IPC
YARN ResourceManager 8088 yarn.resourcemanager.webapp.address http服務端口
YARN NodeManager 8040 yarn.nodemanager.localizer.address localizer IPC
YARN NodeManager 8042 yarn.nodemanager.webapp.address http服務端口
YARN NodeManager 8041 yarn.nodemanager.address NM中container manager的端口
YARN JobHistory Server 10020 mapreduce.jobhistory.address IPC
YARN JobHistory Server 19888 mapreduce.jobhistory.webapp.address http服務端口
HBase Master 60000 hbase.master.port IPC
HBase Master 60010 hbase.master.info.port http服務端口
HBase RegionServer 60020 hbase.regionserver.port IPC
HBase RegionServer 60030 hbase.regionserver.info.port http服務端口
HBase HQuorumPeer 2181 hbase.zookeeper.property.clientPort HBase-managed ZK mode,使用獨立的ZooKeeper集羣則不會啓用該端口。
HBase HQuorumPeer 2888 hbase.zookeeper.peerport HBase-managed ZK mode,使用獨立的ZooKeeper集羣則不會啓用該端口。
HBase HQuorumPeer 3888 hbase.zookeeper.leaderport HBase-managed ZK mode,使用獨立的ZooKeeper集羣則不會啓用該端口。
Hive Metastore 9083 /etc/default/hive-metastore中export PORT=<port>來更新默認端口  
Hive HiveServer 10000 /etc/hive/conf/hive-env.sh中export HIVE_SERVER2_THRIFT_PORT=<port>來更新默認端口  
ZooKeeper Server 2181 /etc/zookeeper/conf/zoo.cfg中clientPort=<port> 客戶端提供服務的端口
ZooKeeper Server 2888 /etc/zookeeper/conf/zoo.cfg中server.x=[hostname]:nnnnn[:nnnnn],標藍部分 follower用來連接到leader,只在leader上監聽該端口。
ZooKeeper Server 3888 /etc/zookeeper/conf/zoo.cfg中server.x=[hostname]:nnnnn[:nnnnn],標藍部分 用於leader選舉的。只在electionAlg是1,2或3(默認)時需要。

所有端口協議均基於TCP。
對於存在Web UI(HTTP服務)的所有hadoop daemon,有如下url:
/logs 
日誌文件列表,用於下載和查看
/logLevel 
允許你設定log4j的日誌記錄級別,類似於hadoop daemonlog
/stacks 
所有線程的stack trace,對於debug很有幫助
/jmx 
服務端的Metrics,以JSON格式輸出。
/jmx?qry=Hadoop:*會返回所有hadoop相關指標。 
/jmx?get=MXBeanName::AttributeName 查詢指定bean指定屬性的值,例如/jmx?get=Hadoop:service=NameNode,name=NameNodeInfo::ClusterId會返回ClusterId。 
這個請求的處理類:org.apache.hadoop.jmx.JMXJsonServlet
而特定的Daemon又有特定的URL路徑特定相應信息。
NameNode:http://:50070/
/dfshealth.jsp 
HDFS信息頁面,其中有鏈接可以查看文件系統
/dfsnodelist.jsp?whatNodes=(DEAD|LIVE) 
顯示DEAD或LIVE狀態的datanode
/fsck 
運行fsck命令,不推薦在集羣繁忙時使用!
DataNode:http://:50075/
/blockScannerReport 
每個datanode都會指定間隔驗證塊信息

補充一些內容:

  • 需要知道的默認配置
在Hadoop 2.2.0中,YARN框架有很多默認的參數值,如果你是在機器資源比較不足的情況下,需要修改這些默認值,來滿足一些任務需要。
NodeManager和ResourceManager都是在yarn-site.xml文件中配置的,而運行MapReduce任務時,是在mapred-site.xml中進行配置的。
下面看一下相關的參數及其默認值情況:
參數名稱
默認值
進程名稱
配置文件
含義說明
yarn.nodemanager.resource.memory-mb 8192 NodeManager yarn-site.xml 從節點所在物理主機的可用物理內存總量
yarn.nodemanager.resource.cpu-vcores 8 NodeManager yarn-site.xml 節點所在物理主機的可用虛擬CPU資源總數(core)
yarn.nodemanager.vmem-pmem-ratio 2.1 NodeManager yarn-site.xml 使用1M物理內存,最多可以使用的虛擬內存數量
yarn.scheduler.minimum-allocation-mb 1024 ResourceManager yarn-site.xml 一次申請分配內存資源的最小數量
yarn.scheduler.maximum-allocation-mb 8192 ResourceManager yarn-site.xml 一次申請分配內存資源的最大數量
yarn.scheduler.minimum-allocation-vcores 1 ResourceManager yarn-site.xml 一次申請分配虛擬CPU資源最小數量
yarn.scheduler.maximum-allocation-vcores 8 ResourceManager yarn-site.xml 一次申請分配虛擬CPU資源最大數量
mapreduce.framework.name local MapReduce mapred-site.xml 取值local、classic或yarn其中之一,如果不是yarn,則不會使用YARN集羣來實現資源的分配
mapreduce.map.memory.mb 1024 MapReduce mapred-site.xml 每個MapReduce作業的map任務可以申請的內存資源數量
mapreduce.map.cpu.vcores 1 MapReduce mapred-site.xml 每個MapReduce作業的map任務可以申請的虛擬CPU資源的數量
mapreduce.reduce.memory.mb 1024 MapReduce mapred-site.xml 每個MapReduce作業的reduce任務可以申請的內存資源數量
yarn.nodemanager.resource.cpu-vcores 8 MapReduce mapred-site.xml 每個MapReduce作業的reduce任務可以申請的虛擬CPU資源的數量




原文地址:http://www.aboutyun.com/thread-7513-1-1.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章