zabbix 錯誤報警

   zabbix 突然間報:Zabbix agent on {HOST.NAME} is unreachable for 5 minutes

   N多機器都有這樣的報警;

   登陸查看被監控機,一切正常,網絡一切正常;

   查看zabbix agent 日誌,沒有異常;

   查看zabbix server 日誌 ,大部分提示信息爲:

   

21567:20131203:141448.893 [Z3005] query failed: [1205] Lock wait timeout exceeded; try restarting transaction [update ids set nextid=nextid+1 where nodeid=0 and table_name='events' and field_name='eventid']

zabbix_server [21567]: ERROR [file:db.c,line:1501] Something impossible has just happened.

update triggers set lastchange=1386049597,value=1 where triggerid=14912;

update ids set nextid=nextid+1 where nodeid=0 and table_name='events' and field_name='eventid'

delete from escalations where escalationid between 364655 and 364665

   登陸MySQL查看,錯誤日誌中的SQL都處在 lock wait 狀態,磁盤IO利用率100%,

   應該是IO導致的問題,可以從這條語句判斷:update triggers set lastchange=1386049597,value=1 where triggerid=14912; 觸發器的狀態沒有更新過來;

143939340.jpg

   IO高的原因是 其他機器在向它scp數據,

   數據scp完畢後,zabbix也恢復正常,原以爲是zabbixbug,剩下的事情就是優化數據庫,修改zabbix的語句!

   

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章