hadoop 的一些錯誤

1：Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out
Answer：
程序裏面需要打開多個文件，進行分析，系統一般默認數量是1024，（用ulimit -a可以看到）對於正常使用是夠了，但是對於程序來講，就太少了。
修改辦法：
修改2個文件。
/etc/security/limits.conf
vi /etc/security/limits.conf
加上：
* soft nofile 102400
* hard nofile 409600

$cd /etc/pam.d/
$sudo vi login
添加 session    required     /lib/security/pam_limits.so

2：Too many fetch-failures
Answer:
出現這個問題主要是結點間的連通不夠全面。
1) 檢查、/etc/hosts
   要求本機ip 對應服務器名
   要求要包含所有的服務器ip + 服務器名
2) 檢查 .ssh/authorized_keys
   要求包含所有服務器（包括其自身）的public key

3：處理速度特別的慢出現map很快但是reduce很慢而且反覆出現 reduce=0%
Answer:
結合第二點，然後
修改 conf/hadoop-env.sh 中的export HADOOP_HEAPSIZE=4000

4：能夠啓動datanode，但無法訪問，也無法結束的錯誤
在重新格式化一個新的分佈式文件時，需要將你NameNode上所配置的dfs.name.dir這一namenode用來存放NameNode 持久存儲名字空間及事務日誌的本地文件系統路徑刪除，同時將各DataNode上的dfs.data.dir的路徑 DataNode 存放塊數據的本地文件系統路徑的目錄也刪除。如本此配置就是在NameNode上刪除/home/hadoop/NameData，在DataNode上刪除/home/hadoop/DataNode1和/home/hadoop/DataNode2。這是因爲Hadoop在格式化一個新的分佈式文件系統時，每個存儲的名字空間都對應了建立時間的那個版本（可以查看/home/hadoop /NameData/current目錄下的VERSION文件，上面記錄了版本信息），在重新格式化新的分佈式系統文件時，最好先刪除NameData 目錄。必須刪除各DataNode的dfs.data.dir。這樣纔可以使namedode和datanode記錄的信息版本對應。
注意：刪除是個很危險的動作，不能確認的情況下不能刪除！！做好刪除的文件等通通備份！！

5：java.io.IOException: Could not obtain block: blk_194219614024901469_1100 file=/user/hive/warehouse/src_20090724_log/src_20090724_log
出現這種情況大多是結點斷了，沒有連接上。

6：java.lang.OutOfMemoryError: Java heap space
出現這種異常，明顯是jvm內存不夠得原因，要修改所有的datanode的jvm內存大小。
Java -Xms1024m -Xmx4096m
一般jvm的最大內存使用應該爲總內存大小的一半，我們使用的8G內存，所以設置爲4096m，這一值可能依舊不是最優的值。（其實對於最好設置爲真實物理內存大小的0.8）
7：出現map%,但是呢reduce到98%左右的時候呢，就直接進failedjobs了
解決辦法：
檢查mapred.map.tasks是不是設置的太多了，設置太多的話會導致處理大量的小文件
檢查mapred.reduce.parallel.copies是否設置合適。

8:
系統根目錄下的/tmp文件夾是不可以刪除的
否則bin/hadoop jps
會出現異常：
Exception in thread "main" java.lang.NullPointerException  at sun.jvmstat.perfdata.monitor.protocol.local.LocalVmManager.activeVms(LocalVmManager.java:127)
        at sun.jvmstat.perfdata.monitor.protocol.local.MonitoredHostProvider.activeVms(MonitoredHostProvider.java:133)
        at sun.tools.jps.Jps.main(Jps.java:45)
同時
bin/hive
Unable to create log directory /tmp/hadoopuser

2：Too many fetch-failures
Answer:
出現這個問題主要是結點間的連通不夠全面。
1) 檢查、/etc/hosts
   要求本機ip 對應服務器名
   要求要包含所有的服務器ip + 服務器名
2) 檢查 .ssh/authorized_keys
   要求包含所有服務器（包括其自身）的public key

3：處理速度特別的慢出現map很快但是reduce很慢而且反覆出現 reduce=0%
Answer:
結合第二點，然後
修改 conf/hadoop-env.sh 中的export HADOOP_HEAPSIZE=4000

4：能夠啓動datanode，但無法訪問，也無法結束的錯誤
在重新格式化一個新的分佈式文件時，需要將你NameNode上所配置的dfs.name.dir這一namenode用來存放NameNode 持久存儲名字空間及事務日誌的本地文件系統路徑刪除，同時將各DataNode上的dfs.data.dir的路徑 DataNode 存放塊數據的本地文件系統路徑的目錄也刪除。如本此配置就是在NameNode上刪除/home/hadoop/NameData，在DataNode上刪除/home/hadoop/DataNode1和/home/hadoop/DataNode2。這是因爲Hadoop在格式化一個新的分佈式文件系統時，每個存儲的名字空間都對應了建立時間的那個版本（可以查看/home/hadoop /NameData/current目錄下的VERSION文件，上面記錄了版本信息），在重新格式化新的分佈式系統文件時，最好先刪除NameData 目錄。必須刪除各DataNode的dfs.data.dir。這樣纔可以使namedode和datanode記錄的信息版本對應。
注意：刪除是個很危險的動作，不能確認的情況下不能刪除！！做好刪除的文件等通通備份！！

5：java.io.IOException: Could not obtain block: blk_194219614024901469_1100 file=/user/hive/warehouse/src_20090724_log/src_20090724_log
出現這種情況大多是結點斷了，沒有連接上。

6：java.lang.OutOfMemoryError: Java heap space
出現這種異常，明顯是jvm內存不夠得原因，要修改所有的datanode的jvm內存大小。
Java -Xms1024m -Xmx4096m
一般jvm的最大內存使用應該爲總內存大小的一半，我們使用的8G內存，所以設置爲4096m，這一值可能依舊不是最優的值。（其實對於最好設置爲真實物理內存大小的0.8）
7：出現map%,但是呢reduce到98%左右的時候呢，就直接進failedjobs了
解決辦法：
檢查mapred.map.tasks是不是設置的太多了，設置太多的話會導致處理大量的小文件
檢查mapred.reduce.parallel.copies是否設置合適。

8:
系統根目錄下的/tmp文件夾是不可以刪除的
否則bin/hadoop jps
會出現異常：
Exception in thread "main" java.lang.NullPointerException  at sun.jvmstat.perfdata.monitor.protocol.local.LocalVmManager.activeVms(LocalVmManager.java:127)
        at sun.jvmstat.perfdata.monitor.protocol.local.MonitoredHostProvider.activeVms(MonitoredHostProvider.java:133)
        at sun.tools.jps.Jps.main(Jps.java:45)
同時
bin/hive
Unable to create log directory /tmp/hadoopuser

（jps is based on jvmstat and it needs to be able to secure a memory mapped file on the temporary file system.

）
否則bin/hadoop jps
會出現異常：
Exception in thread "main" java.lang.NullPointerException  at sun.jvmstat.perfdata.monitor.protocol.local.LocalVmManager.activeVms(LocalVmManager.java:127)
        at sun.jvmstat.perfdata.monitor.protocol.local.MonitoredHostProvider.activeVms(MonitoredHostProvider.java:133)
        at sun.tools.jps.Jps.main(Jps.java:45)
同時
bin/hive
Unable to create log directory /tmp/hadoopuser

zreodown

發佈了102 篇原創文章 · 獲贊 10 · 訪問量 27萬+

私信關注

hadoop 的一些錯誤

hive列

spring 定時器補充

關於YUM問題

Hive中LIKE查詢使用通配符'%'的一個BUG--當轉義符'\'遇到通配符'%'或'_'

spark-sql 優化

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結