0824-7.1.4-Kudu時間同步了還是報時間未同步異常處理

作者:周鵬輝

文檔編寫目的



Kudu對時間同步有嚴格的要求,本文檔描述了一次集羣已經使用NTP進行時間同步,Kudu組件還是報時間未同步問題處理流程。

  • 測試環境

1.CDH和CM版本:CDP7.1.4和CM7.1.4

2.集羣啓用Kerbeos+OpenLDAP+Ranger


問題描述



1.如下集羣所有Kudu實例異常


2.查看日誌報時間未同步相關異常


3.查看我們已經使用NTP進行時間正常同步,而且集羣其他服務都沒有問題,就Kudu組件有問題


問題分析



1.日誌裏面Kudu有報could not find executable :chrony異常,按照如下KB介紹【1】,排查我們並沒有使用chronyc。

【1】

https://my.cloudera.com/knowledge/Kudu-service-shows-error-quot-Cannot-initialize-clock-Error?id=74857


2.於是嘗試按照Kudu官網的介紹【2】

【2】

https://kudu.apache.org/releases/1.13.0/docs/troubleshooting.html#_monitoring_clock_synchronization_status_with_the_ntp_suite


執行如下命令,收集節點NTP時間同步相關信息,發現NTP同步信息一切正常。

ntptime
ntpq -nc lpeers
ntpq -nc opeers


3.再檢查ntpd進程是否用“-x“這個選項啓動,如果是的話, 請移除這個選項,重新啓動ntpd


問題解決



1.修改Kudu節點的/etc/sysconfig/ntpd文件,把-x參數刪除,重啓ntpd、 cloudera-scm-agent、Kudu實例,問題解決。


修改並且重啓ntpd後,ntpd 進程不帶-x參數


總結



1.根據KB【2】的解釋,NTP啓動中有-x和沒有-x是如何影響Kudu tablet servers已經很清楚了。

【2】

https://kudu.apache.org/releases/1.13.0/docs/troubleshooting.html#_monitoring_clock_synchronization_status_with_the_ntp_suite


2. ntpd服務的方式,有兩種策略,一種是平滑、緩慢的漸進式調整(adjusts the clock in small steps所謂的微調);一種是步進式調整(跳躍式調整)。兩種策略的區別就在於,微調方式在啓動NTP服務時加了個“-x”的參數,而默認的是不加“-x”參數。假如使用了-x選項,那麼ntpd只做微調,不跳躍調整時間,但是要注意,-x參數的負作用:當時鐘差大的時候,同步時間將花費很長的時間。-x也有一個閾值,就是600s,當系統時鐘與標準時間差距大於600s時,ntpd會使用較大“步進值”的方式來調整時間,將時鐘“步進”調整到正確時間。假如不使用-x選項,那麼ntpd在時鐘差距小於128ms時,使用微調方式調整時間,當時差大於128ms時,使用“跳躍”式調整。

本文分享自微信公衆號 - Hadoop實操(gh_c4c535955d0f)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章