CDH環境快速恢復不同步的JournalNode

原創

2020-07-06 21:06

背景：

CDH集羣中一個DataNode節點宕機後所有服務中斷，其他節點正常運行並存儲了大量新數據。

在恢復宕機節點後，重啓其DataNode與JournalNode，之後CM報出JournalNode不同步的錯誤，如下圖。

處理：

1、停止bigdata168上不同步的JournalNode服務（在CM上操作角色）

2、備份bigdata168服務器上JournalNode的數據目錄（可跳過）

cp -r /dfs/jn /opt/backup/cdh/jn

3、刪除bigdata168服務器上JournalNode的數據目錄下以edits_inprogress_開頭的所有文件，注意是edits_inprogress開頭的。

rm -rf /dfs/jn/nameservice-ha/edits_inprogress_*

4、重啓bigdata168服務器上的JournalNode（在CM上操作角色），之後它會自動向正常節點同步數據，恢復edits_inprogress文件。

等待一段時間，該JournalNode就會恢復。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

CDH相關大數據文件包下載地址-

下載CDH包地址： http://archive.cloudera.com/cdh5/cdh/5/ kafka下載地址： http://archive.cloudera.com/kafka/kafka/ zookeeper下載地址： ht

一只小菜鸟(*￣︶￣)

2020-06-29 18:59:26

Flink1.9.1源碼編譯支持hadoop-2.6.0-cdh5.16.2

準備 jdk-8u211-linux-x64.tar.gz flink-1.9.1-src.tgz flink-shaded-7.0-src.tgz apache-maven-3.6.1-bin.tar.g

好笨的菜鸟

2020-07-06 03:20:04

在HUE配置工作流

--hue配置工作流首先配置workflow，左上角藍色shedule->shedule->wordkflow My Workflow改成WF-BIBASE-RRS_B2C_DSR_DIM 描述改成'工作流-BI落地表-DSR落地信息表

2020-07-04 23:17:34

【解決hue只能導出10萬的限制】

1.這裏賬戶查一下。 2.修改配置文件 find / -name beeswax 選擇這個帶src的。 vim 該文件 DOWNLOAD_CELL_LIMIT = Config( key='download_c

2020-07-03 05:39:31

基於CDH6.2kylin2.6.2安裝部署

kylin安裝前提是CDH6.2需要正常安裝，hbase、hive、hdfs、spark(雖然官網是說spark可選安裝，但是在kylin啓動腳本中包含對spark環境的檢測，所以建議CDH添加spark服務)需要正常啓動，且沒有報錯信息

2020-07-02 09:20:58

客戶環境沒辦法查看Spark UI頁面，怎麼辦？讓我們來使用Spark REST API查看作業信息吧！

文章目錄場景環境IP關係使用步驟1. 獲取鏈接IP及端口1. 獲取spark主機域名或ip（適用於查找歷史應用）2. 根據日誌查找該應用運行的鏈接（適用於查找運行中應用）2. 查看方法總結求贊、求轉發、求粉URL 參數清單場景

2020-07-01 22:56:07

問題解決：Given NMToken for application : appattempt_xxx is not valid for current node manager

文章目錄問題場景問題環境問題原因解決方案結果總結隨緣求贊問題場景登錄服務器，使用hive -f test.sql命令，啓動了統計腳本。但是，經過了SQL校驗通過之後，啓動就報錯了。登錄Hadoop控制檯，點開了自己的應用，發現

2020-07-01 22:56:07

問題解決：java運行HiveQL，報錯：java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration

文章目錄問題場景問題環境問題原因解決方案結果總結隨緣求贊問題場景使用Java編寫HiveQL語句，然後通過jdbc的方式遠程連接hive集羣，並執行。在執行過程中，報錯，錯誤信息如下： java.lang.NoClassDef

2020-07-01 22:56:07

CDH6.2.0搭建（史上最全的安裝教程）

1 集羣準備 1 首先準備三臺虛擬機，虛擬機ip地址可以ping通。 ip 名稱 192.168.63.131 cdh1 192.168.63.132 cdh2 192.168.63.133 cdh3 2 修改IP和主機

在IT中穿梭旅行

2020-06-30 09:26:38

使用Apache Atlas管理CDH元數據，以及beeline的hive-hook問題的解決

編譯。在官網下載好需要的包之後進行編譯，這部分基本看官方安裝文檔就行。需要注意的是maven版本3.6以上的話，1.1和1.0編譯會報錯，本人親試。1.2和2.0兩個版本個人體驗好像沒什麼差別，只有配置文件有點不一樣（2.0是hbas

2020-06-30 08:18:35

CDH 6.3.1 設置郵件告警功能【2020年06月】

操作步驟 1.登錄cloudera manager頁面，進入cloudera manager service服務 2.單擊配置，在搜索框輸入alert,檢索相關配置項 3.設置郵箱等相關參數這個端口折騰了很久，祝你好運🍀

2020-06-29 15:35:51

Starting cloudera-scm-server: [FAILED]

遇到一個問題，在CDH中一個結點內存不夠用，於是關閉CDH服務後，並且把虛擬機關閉了。重啓虛擬機後在執行 /opt/cloudera-manager/cm-5.4.3/etc/init.d/cloudera-scm-server st

2020-06-29 03:49:05

Cloudera Manager的備份和災難恢復

注：只有Cloudera Manager企業版纔有Cloudera Manager的備份和災難恢復功能一、概述 Cloudera Manager提供了一個集成的、易於使用的管理解決方案，使數據保護在Hadoop的平臺。Cloud

2020-06-27 12:20:08

卸載Cloudera Manager(CM)和Cloudera Data Hub(CDH)

1、先在Manage管理端移除所有服務。2、刪除Manager Server在Manager節點運行$ sudo /usr/share/cmf/uninstall-cloudera-manager.sh如果沒有該腳本，則可以手動刪除，先停

2020-06-27 12:20:07

Hive 1.1.0分區表新增字段後，數據爲空的解決辦法

如果使用alter table add column語句對分區表增加字段時沒有使用cascade關鍵字，會導致Hive只維護了表的元數據，而沒有分區的元數據。現象就是，重新insert overwrite了歷史有數據的分區，但是sele

2020-06-26 13:20:24

24小時熱門文章

最新文章

CDH環境快速恢復不同步的JournalNode

最新評論文章