postgresql之checkpoints

checkpoint又名檢查點,在oracle中checkpoint的發生意味着之前的髒數據全部寫回磁盤,數據庫實現了一致性與數據完整性。oracle在實現介質恢復時將以最近的checkpoint爲參照點執行事務前滾。在postgresql中checkpoint起着相同的作用:寫髒數據;完成數據庫的完整性檢查。

checkpoints相關參數:
checkpoint_segments:
WAL log的最大數量,系統默認值是3。該值越大,在執行介質恢復時處理的數據量也越大,時間相對越長。
checkpoint_timeout:
系統自動執行checkpoint之間的最大時間間隔,同樣間隔越大介質恢復的時間越長。系統默認值是5分鐘。
checkpoint_completion_target:
該參數表示checkpoint的完成目標,系統默認值是0.5,也就是說每個checkpoint需要在checkpoints間隔時間的50%內完成。
checkpoint_warning:
系統默認值是30秒,如果checkpoints的實際發生間隔小於該參數,將會在server log中寫入寫入一條相關信息。可以通過設置爲0禁用信息寫入。

checkpoint執行控制:
1,數據量達到checkpoint_segments*16M時,系統自動觸發;
2,時間間隔達到checkpoint_timeout參數值時;
3,用戶發出checkpoint命令時。

checkpoints參數調整:
正確合適的參數值總能夠給系統帶來益處,checkpoints參數合理的配置不僅能夠減少系統IO寫入的阻塞,同時還會減少高峯時IO給系統帶來的壓力。
首先可以通過觀察checkpoint_warning參數寫入的日誌,來估算系統寫入的數據量:一般情況下checkpoint_warning參數值小於checkpoint_timeout;
估算公式:checkpoint_segments*16M*(60s/m)/checkpoint_warning=大致每分鐘數據量,得到每分鐘寫入的數據量(這裏全部是估算,建立在warning參數的合理設置上)。
合理配置情況:checkpoint_segments*16M*checkpoint_timeout(m)略大於上述值.
以上述公式爲依據,配置checkpoint_segments與checkpoint_timeout,兩個參數應該儘量平衡爲一個足夠大和足夠小的值。
在數據量異常高的情況下應該考慮,磁盤帶寬與checkpoint時數據量的關係。

個人觀點:
假如以checkpoint_segments參數爲閥值時,可以計算高峯時需要的帶寬(秒):checkpoint_segments*16M/(checkpoint_warning*checkpoint_completion_target)。
假如以checkpoint_timeout參數爲閥值時,checkpoint_warning值最好大於等於checkpoint_timeout,通過監控系統數據字典統計寫入的數據量Total。
Total/(checkpoint_timeout*checkpoint_completion_target)得到IO的帶寬要求。

歡迎大家一起討論。


轉自:http://www.cnblogs.com/daduxiong/archive/2010/09/28/1837682.html  

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章