1.看門狗定義
Linux 自帶了一個 watchdog 的實現,用於監視系統的運行,包括一個內核 watchdog module 和一個用戶空間的 watchdog 程序。
內核 watchdog 模塊通過 /dev/watchdog 這個字符設備與用戶空間通信。用戶空間程序一旦打開 /dev/watchdog 設備(俗稱“開門放狗”),就會導致在內核中啓動一個1分鐘的定時器(系統默認時間),此後,用戶空間程序需要保證在1分鐘之內向這個設備寫入數據(俗稱“定期餵狗”),每次寫操作會導致重新設定定時器。如果用戶空間程序在1分鐘之內沒有寫操作,定時器到期會導致一次系統 reboot 操作(“狗咬人了”呵呵)。通過這種機制,我們可以保證系統核心進程大部分時間都處於運行狀態,即使特定情形下進程崩潰,因無法正常定時“餵狗”,Linux系統在看門狗作用下重新啓動(reboot),核心進程又運行起來了。多用於嵌入式系統。
打開 /dev/watchdog 設備(“開門放狗”):
int fd_watchdog = open("/dev/watchdog", O_WRONLY);
if(fd_watchdog == -1) {
int err = errno;
printf("\n!!! FAILED to open /dev/watchdog, errno: %d, %s\n", err, strerror(err));
syslog(LOG_WARNING, "FAILED to open /dev/watchdog, errno: %d, %s", err, strerror(err));
}
每隔一段時間向 /dev/watchdog 設備寫入數據(“定期餵狗”):
//feed the watchdog
if(fd_watchdog >= 0) {
static unsigned char food = 0;
ssize_t eaten = write(fd_watchdog, &food, 1);
if(eaten != 1) {
puts("\n!!! FAILED feeding watchdog");
syslog(LOG_WARNING, "FAILED feeding watchdog");
}
}
關閉 /dev/watchdog 設備,通常不需要這個步驟:
close(fd_watchdog);