IMC 利用BFD產生Syslog來監控線路通斷狀態

    好久沒寫東西,也好久沒來51博客,說工作忙也是藉口,這篇文章早就想寫了的,但一直都沒有去實踐,只是想想而已,任何想法,只有去實施了,纔會有意義。寫文章一是總結經驗,理清思路,時間長了忘記了,還可以回來看看。好了不胡扯了,進入正題!


    IMC是華三的智能管理平臺,有很多功能,最基礎的就是網絡設備監控管理功能,具體的可以上華三的官網查詢,在對線路狀態進行監控時,如果客戶的網絡是租用運營商MSTP專線(政府、金融)時,有一種情況IMC平臺的基礎監控功能是沒法監控線路的中斷的,平臺也不會產生告警,也就是運營商的MSTP專線中間環節某處出現故障,但客戶兩端的設備接口都正常(如下圖1的部署情況),IMC平臺的網絡拓撲圖看着線路也是綠色的(綠色表示線路正常,紅色表示線路中斷),設備兩端互聯接口狀態也是正常的,接口物理層和協議層都是UP狀態,這時平臺就不會產生告警,IMC平臺的檢查線路中斷的機制有兩種:

   1)、通過設備發送trap信息至IMC平臺,平臺匹配預設的trap機制產生告警;

   上述情況,因爲兩端設備的端口狀態都是UP的,不會產生trap信息;

   2)、通過平臺預設的輪詢機制去檢查網絡設備的端口狀態;

   上述情況,因爲兩端設備的端口狀態物理層和協議層都是up狀態,平臺輪詢設備接口時,也不會產生告警;

wKiom1gG6CzwZ34LAAA_e0_M2e8107.png-wh_50

   對於上述情況,就導致監控線路的通斷產生盲點,只有分支機構設備不可達時(兩條線路都中斷),纔會知道線路已經故障,這時分支機構已經停業,對於運維來說,最重要的就是預防停業事故,有故障及早發現處理;

   對此可以通過設備兩端配置BFD進行線路的檢查,當線路中斷時,BFD會話會從UP->DOWN,然後設備會產生syslog的日誌,通過發送日誌到平臺,最終利用平臺的syslog升級爲告警功能來產生線路中斷的告警信息,這樣就能保證監控的實時性,做到發生故障及時處理;


具體配置實施如下(以華三的設備舉例,其它廠商的設備沒有驗證過,不知道平臺能否解析其它廠商的syslog日誌),下面的配置是基於分支機構與總部之間運行OSPF的前提下進行的配置的,如果總部與分支機構間沒有運營動態路由協議,可以採用BFD Echo報文方式進行線路的通斷檢查,網絡設備的配置可以參考手冊,IMC平臺的配置與下述的相同。


1、分支機構設備R3的配置

interface GigabitEthernet0/0/0

 description To_XXXX

 ip address 99.3.251.129 255.255.255.252

 ospf bfd enable

 bfd min-transmit-interval 1000

    bfd min-receive-interval 1000  

    

interface GigabitEthernet0/0/1

 description To_XXXX

 ip address 99.3.250.129 255.255.255.252

 ospf bfd enable

 bfd min-transmit-interval 1000

    bfd min-receive-interval 1000 

info enable

info loghost 192.168.2.10

info-center source BFD channel loghost  //配置BFD會話的日誌發送至IMC平臺


2、總部設備R1和R2的配置

interface GigabitEthernet0/0/1     //R1

 description To_XXXX

 ip address 99.3.251.130 255.255.255.252

 ospf bfd enable

 bfd min-transmit-interval 1000

    bfd min-receive-interval 1000  

    info enable

info loghost 192.168.2.10

info-center source BFD channel loghost 


interface GigabitEthernet0/0/1    //R2

 description To_XXXX

 ip address 99.3.250.130 255.255.255.252

 ospf bfd enable

 bfd min-transmit-interval 1000

    bfd min-receive-interval 1000 

info enable

info loghost 192.168.2.10

info-center source BFD channel loghost  


3、IMC平臺的配置

   在告警-Syslog管理中進行配置,首先配置解析模板庫(解析網絡設備發過來的syslog日誌),再配置升級告警規則(如果匹配解析模板後,就其升級爲相應的告警級別);

   BFD的syslog日誌會有幾種狀態,還以設備的軟件版本(V7和V5)有關,版本不同,解析模板也會不同,因此需要以產生的BFD會話狀態的syslog日誌來寫解析模板,下面的配置是以V5版本的舉例的;

   1)、配置解析模板  

   BFD會話從UP-DOWN的狀態,此時表示線路故障了;

   腳本:BFD/5/*Sess[$(本端IP地址)/$(對端IP地址),*,$(接口),Ctrl], Sta: UP->DOWN, Diag: *

wKioL1gG6JSTqzgaAACeSR1gla4111.png-wh_50

   

     BFD會話從DOWN-UP的狀態,表示線路恢復正常;

    腳本:BFD/5/*Sess[$(本端IP地址)/$(對端IP地址),*,$(接口),Ctrl], Sta:*->UP, Diag: *

wKiom1gG6OHy0E6sAAB9cTcwbWA788.png-wh_50


   2)、配置升級告警規則

    主要是將平臺收到設備BFD會話狀態變化產生的日誌,匹配告警,使其在告警欄中顯示,以便運維人員通夠及時查看;

wKiom1gG6WLzPqZVAABzUZR2KGw650.png-wh_50

wKioL1gG6YKQ8PCjAADYszSxl_w340.png-wh_50

 

   3)、配置恢復告警規則

   恢復告警主要是線路故障恢復後,告警也要從告警欄中消失,主要匹配的是BFD會話從down-up;

wKiom1gG6hLQrSDfAACUtBzf0mE380.png-wh_50


對此基本配置已經完成,下面是生產網絡中的實際效果;

wKioL1gG6x3htOEWAAE4F3xXK9o968.png-wh_50

wKioL1gG60OB4CJuAABGFAe1Teg450.png-wh_50


   算寫完了,解析模板那兒的腳本在寫的時候,一定要注意空格,我在調試過程中,Ctrl], Sta:*->UP, Diag: * “,”後面是空格,當時沒加空格,怎麼測試,收到的syslog日誌怎麼也無法產生告警,也無法關聯網絡拓撲圖。






發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章