CDH环境快速恢复不同步的JournalNode

原創

2020-07-06 21:06

背景：

CDH集群中一个DataNode节点宕机后所有服务中断，其他节点正常运行并存储了大量新数据。

在恢复宕机节点后，重启其DataNode与JournalNode，之后CM报出JournalNode不同步的错误，如下图。

处理：

1、停止bigdata168上不同步的JournalNode服务（在CM上操作角色）

2、备份bigdata168服务器上JournalNode的数据目录（可跳过）

cp -r /dfs/jn /opt/backup/cdh/jn

3、删除bigdata168服务器上JournalNode的数据目录下以edits_inprogress_开头的所有文件，注意是edits_inprogress开头的。

rm -rf /dfs/jn/nameservice-ha/edits_inprogress_*

4、重启bigdata168服务器上的JournalNode（在CM上操作角色），之后它会自动向正常节点同步数据，恢复edits_inprogress文件。

等待一段时间，该JournalNode就会恢复。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

CDH相关大数据文件包下载地址-

下載CDH包地址： http://archive.cloudera.com/cdh5/cdh/5/ kafka下載地址： http://archive.cloudera.com/kafka/kafka/ zookeeper下載地址： ht

一只小菜鸟(*￣︶￣)

2020-06-29 18:59:26

Flink1.9.1源码编译支持hadoop-2.6.0-cdh5.16.2

準備 jdk-8u211-linux-x64.tar.gz flink-1.9.1-src.tgz flink-shaded-7.0-src.tgz apache-maven-3.6.1-bin.tar.g

好笨的菜鸟

2020-07-06 03:20:04

在HUE配置工作流

--hue配置工作流首先配置workflow，左上角藍色shedule->shedule->wordkflow My Workflow改成WF-BIBASE-RRS_B2C_DSR_DIM 描述改成'工作流-BI落地表-DSR落地信息表

2020-07-04 23:17:34

【解决hue只能导出10万的限制】

1.這裏賬戶查一下。 2.修改配置文件 find / -name beeswax 選擇這個帶src的。 vim 該文件 DOWNLOAD_CELL_LIMIT = Config( key='download_c

2020-07-03 05:39:31

基于CDH6.2kylin2.6.2安装部署

kylin安裝前提是CDH6.2需要正常安裝，hbase、hive、hdfs、spark(雖然官網是說spark可選安裝，但是在kylin啓動腳本中包含對spark環境的檢測，所以建議CDH添加spark服務)需要正常啓動，且沒有報錯信息

2020-07-02 09:20:58

客户环境没办法查看Spark UI页面，怎么办？让我们来使用Spark REST API查看作业信息吧！

文章目錄場景環境IP關係使用步驟1. 獲取鏈接IP及端口1. 獲取spark主機域名或ip（適用於查找歷史應用）2. 根據日誌查找該應用運行的鏈接（適用於查找運行中應用）2. 查看方法總結求贊、求轉發、求粉URL 參數清單場景

2020-07-01 22:56:07

问题解决：Given NMToken for application : appattempt_xxx is not valid for current node manager

文章目錄問題場景問題環境問題原因解決方案結果總結隨緣求贊問題場景登錄服務器，使用hive -f test.sql命令，啓動了統計腳本。但是，經過了SQL校驗通過之後，啓動就報錯了。登錄Hadoop控制檯，點開了自己的應用，發現

2020-07-01 22:56:07

问题解决：java运行HiveQL，报错：java.lang.NoClassDefFoundError: org/apache/hadoop/conf/Configuration

文章目錄問題場景問題環境問題原因解決方案結果總結隨緣求贊問題場景使用Java編寫HiveQL語句，然後通過jdbc的方式遠程連接hive集羣，並執行。在執行過程中，報錯，錯誤信息如下： java.lang.NoClassDef

2020-07-01 22:56:07

CDH6.2.0搭建（史上最全的安装教程）

1 集羣準備 1 首先準備三臺虛擬機，虛擬機ip地址可以ping通。 ip 名稱 192.168.63.131 cdh1 192.168.63.132 cdh2 192.168.63.133 cdh3 2 修改IP和主機

在IT中穿梭旅行

2020-06-30 09:26:38

使用Apache Atlas管理CDH元数据，以及beeline的hive-hook问题的解决

編譯。在官網下載好需要的包之後進行編譯，這部分基本看官方安裝文檔就行。需要注意的是maven版本3.6以上的話，1.1和1.0編譯會報錯，本人親試。1.2和2.0兩個版本個人體驗好像沒什麼差別，只有配置文件有點不一樣（2.0是hbas

2020-06-30 08:18:35

CDH 6.3.1 设置邮件告警功能【2020年06月】

操作步驟 1.登錄cloudera manager頁面，進入cloudera manager service服務 2.單擊配置，在搜索框輸入alert,檢索相關配置項 3.設置郵箱等相關參數這個端口折騰了很久，祝你好運🍀

2020-06-29 15:35:51

Starting cloudera-scm-server: [FAILED]

遇到一個問題，在CDH中一個結點內存不夠用，於是關閉CDH服務後，並且把虛擬機關閉了。重啓虛擬機後在執行 /opt/cloudera-manager/cm-5.4.3/etc/init.d/cloudera-scm-server st

2020-06-29 03:49:05

Cloudera Manager的备份和灾难恢复

注：只有Cloudera Manager企業版纔有Cloudera Manager的備份和災難恢復功能一、概述 Cloudera Manager提供了一個集成的、易於使用的管理解決方案，使數據保護在Hadoop的平臺。Cloud

2020-06-27 12:20:08

卸载Cloudera Manager(CM)和Cloudera Data Hub(CDH)

1、先在Manage管理端移除所有服務。2、刪除Manager Server在Manager節點運行$ sudo /usr/share/cmf/uninstall-cloudera-manager.sh如果沒有該腳本，則可以手動刪除，先停

2020-06-27 12:20:07

Hive 1.1.0分区表新增字段后，数据为空的解决办法

如果使用alter table add column語句對分區表增加字段時沒有使用cascade關鍵字，會導致Hive只維護了表的元數據，而沒有分區的元數據。現象就是，重新insert overwrite了歷史有數據的分區，但是sele

2020-06-26 13:20:24

24小時熱門文章

最新文章

CDH環境快速恢復不同步的JournalNode

最新評論文章