KuduTablet設置維護時間
follower_unavailable_considered_failed_sec
默認爲300s,tablet失去聯繫超過300s後,該節點的數據就會在其他節點重建,爲了避免維護造成的不必要的數據移動和拷貝,可以臨時設置此時間爲更長的時間(重啓維護加上tablet重啓後初始化需要的時間)
1.健康檢查
維護前需要健康檢查,如果有任何副本不足的情況,需等待副本拷貝完成後再維護
## sudo -u kudu kudu cluster ksck master-01.example.com,master-02.example.com,master-03.example.com
sudo -u kudu kudu cluster ksck cdh-test-10-9-251-32.lan
2.設置維護時間
目前有Kudu Tablet Server服務的節點如下:
-
cdh-test-10-9-251-30.lan
-
cdh-test-10-9-251-31.lan
-
cdh-test-10-9-251-32.an
-
cdh-test-10-9-251-33.lan
假設需要維護cdh-test-10-9-251-30.an
這個節點爲1h
在所有tablet節點上執行
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 3600
在kudu 1.8以前的版本需要加上--force
參數
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 3600 --force
3.在kudu web管理頁面查看設置是否成功
登錄 http://cdh-test-10-9-251-31.lan:8050/varz 查看是否設置成功
4.維護完成後設置成默認值
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 300 --force
4.生產環境維護步驟
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 86400 --force
sudo -u kudu kudu tserver set_flag $(hostname) follower_unavailable_considered_failed_sec 300 --force