華爲超聚變2288H V5 服務器安裝Windows系統後 PCI數據捕獲和信號處理控制器 出現感嘆號

2288H v5服務器安裝Windows系統後,PCI數據捕獲和信號處理控制器 出現感嘆號

 

 

解決方案:

1、可以在IBMC界面的“診斷-黑匣子” 關閉黑匣子功能,然後重啓設備

 

 2、可以在操作系統側安裝IBMA軟件

軟件下載鏈接:https://support.xfusion.com/support/#/zh/server-management-software/ibma-pid-21099187/software

安裝手冊:https://support.xfusion.com/support/#/zh/server-management-software/ibma-pid-21099187/document

 

上述任意操作後問題解決:

 

注意:iBMA安裝時需要完全解壓,不能在壓縮包內執行,否則出現“版本10.0.x.xxx不支持”。

 

   iBMA可以支持服務器CPU、內存、硬盤、網卡、IB卡、PCIe、RAID卡、光模塊等各個組件的狀態監控、性能監控、事件監控。

   iBMA同時提供了黑匣子功能,開啓黑匣子功能後,能記錄系統發生異常宕機時的狀態信息和調試信息,可以輔助異常定位。iBMA提供了事件上報功能,iBMA週期性檢測物理盤、邏輯盤、RAID控制器等狀態變化事件,有事件變化情況下通過Redfish事件訂閱接口上報事件信息到上層管理軟件。

   用戶在系統上安裝iBMA軟件後,iBMA提供的主要功能如表示。

功能

介紹

系統信息獲取

將操作系統、網卡、IB卡、硬盤、RAID卡等信息提供給iBMC。

文件上傳

支持esight和其它工具通過iBMC的Redfish接口將文件上傳至iBMA運行的服務器,詳細請參考服務器 iBMC Redfish 接口說明

驅動升級

支持eSight和其他工具通過iBMC的Redfish接口進行驅動升級,詳細請參考服務器 iBMC Redfish 接口說明

說明

l  進行驅動升級前需中斷業務。

l  升級過程中不允許對系統進行下電、復位等操作。

系統狀態監控

定時監控系統信息和健康狀態的變化情況,用於上報給iBMC進行告警。

軟件管理

支持FusionDirector和其他工具通過iBMC的Redfish接口進行軟件的查詢、安裝、升級操作。

BOB

l  BOB是一個幫助帶內網絡遠端主機通過帶內組網與本機iBMC進行通信的轉發工具。包括服務連接,如SSH、IPMI、HTTPS等;事件上報,如SNMP Trap等。

l  BOB支持服務管理(啓動/停止/重啓),不支持獨立部署和工作。

l  BOB提供了一個命令行bobCmd,用於啓動/停止/重啓BOB服務以及其他相關配置,轉發配置支持在線配置,無需重啓服務。配置支持持久化,即重啓系統後不會丟失。

iBMC事件轉儲

Linux/Windows系統上支持將iBMC事件轉儲至系統日誌文件中。

說明

對於版本號爲Vxxx格式的iBMC,需要配套V294及以上版本;對於版本號爲x.xx.xx.xx格式的iBMC,需要配套3.01.00.00及以上版本。

Redfish服務兼容HTTPS協議

Redfish服務支持以HTTPS或HTTP協議啓動。

說明

l  對於版本號爲Vxxx格式的iBMC,需要配套V316及以上版本,如果是V316之前版本,配置成以HTTPS協議啓動Redfish服務,則無法與iBMC通信;對於版本號爲x.xx.xx.xx格式的iBMC,需要配套3.01.00.00及以上版本。

l  iBMA支持HTTP和HTTPS兩種協議,HTTP協議明文傳輸,安全性較差;HTTPS協議密文傳輸,安全性較高。

網卡配置追溯

Linux系統支持週期性記錄網卡配置信息。

說明

在Linux系統下,iBMA會定時收集網卡的ethtool最新配置信息,文件存儲在iBMA安裝目錄的log/ethtool_log目錄下,可以使用FusionServer Tools在收集操作系統日誌時一併收集。

網卡故障檢測

l  Linux系統支持Mellanox網卡的internal error檢測,並記錄在iBMA安裝目錄的log/common.log日誌中。

說明

需配套Mellanox網卡4.2及之後的驅動版本。

l  VMware系統支持檢測網口狀態短時間變化事件並上報更新給iBMC。

存儲診斷

定時監控硬盤IO性能降低、硬盤Sense Code錯誤和文件系統只讀的存儲診斷信息並上報給iBMC。支持RAID卡下硬盤日誌的收集,用於硬盤耗損分析。

說明

l  硬盤IO性能降低和文件系統只讀檢測只支持Linux系統。

l  硬盤Sense Code錯誤檢測支持Linux系統、ESXi 6.5及以上版本。

內存隔離

支持對操作系統出現故障的物理內存頁,通過Redfish接口進行軟隔離操作。

說明

l  FusionServer服務器上iBMA支持內存隔離的操作系統爲:Redhat 7.3、Redhat 7.4、Redhat 7.5、Redhat 7.6 、CentOS 7.3、CentOS 7.4、CentOS 7.5、CentOS 7.6、CentOS 7.7、CentOS 7.8、CentOS 7.9、CentOS 8.0、CentOS 8.1、CentOS 8.2、CentOS 8.3、EulerOS 2.0 SP3、EulerOS 2.0 SP5和EulerOS 2.0 SP9系統。

 

iBMC通過iBMA的RESTful接口可實現服務器系統信息的查詢功能,如表所示。

組件

描述

操作系統

查詢OS的基本信息,包括主機名稱、描述、OS的版本(主版本、子版本及補丁主版本及子版本)、內核版本、廠商、系統時間等。

CPU

查詢CPU的基本信息,包括系統CPU佔用率及CPU的個數,型號,單個CPU佔用率等CPU信息。

GPU

查詢GPU的基本信息,包括GPU利用率和GPU內存使用率。

NPU

查詢NPU的基本信息,包括內存資源使用率、HBM資源使用率、內存帶寬資源使用率、HBM帶寬資源使用率、AiCore資源使用率、AiCpu資源使用率、CtrlCpu資源使用率。

內存

查詢內存基本信息,包括查詢系統的內存大小及佔用率。

網口

查詢網卡個數、規格速率、Link狀態、OAM狀態、雙工模式、固件版本、驅動名、網卡驅動版本、槽位信息、PCI-E設備號、功能號、網口名、網口IP、掩碼、網關、MAC地址、VLAN信息、收發包統計等,同時支持系統VLAN、Team及Bridge信息的查詢。

查詢物理網口的速率,當前佔用率。

IB卡

查詢IB卡個數、芯片型號、固件版本、驅動名、驅動版本、槽位信息、PCI-E設備號、UUID、網口類型、設備類型、功能號的全球唯一標識、全球唯一標識、默認gid、端口lid、SM lid、選路掩碼、端口類型、能力地圖、網口名、網口IP、掩碼、網關、MAC地址、規格速率、Link狀態、雙工模式、自協商模式、MTU大小等信息。

說明

只支持Linux系統。

硬盤

查詢物理硬盤個數、廠商、類型、固件版本、序列號、容量、轉速、接口速率、物理槽位、硬盤絲印等信息查詢。

查詢物理硬盤狀態(ONLINE/OFFLINE)、溫度、運行時長、巡檢狀態、重構狀態/進度、SMART信息等。

查詢系統下邏輯盤的容量,已使用大小,使用率等信息。

RAID

支持主流RAID卡,支持服務器有多RAID卡場景。

查詢RAID卡個數、控制器型號、固件版本、驅動版本、槽位信息、條帶深度、Memory大小、ECC計數等。

查詢RAID電池健康狀態、電池類型、名稱、序列號、額定容量、電壓、當前容量、電壓、充放電次數、溫度等信息。

查詢RAID邏輯盤的RAID級別信息、正常/降級/離線狀態,獲取RAID組配置狀態,獲取RAID組中的硬盤物理槽位信息,獲取操作系統盤符與RAID組的關係、支持RAID組條帶寬度、訪問策略、讀寫策略、邏輯盤Cache狀態及是否爲啓動盤等信息。

查詢RAID卡鏈路誤碼,硬盤背板鏈路誤碼。

FC/FCoE

支持FC/FCoE卡的廠家、型號、固件版本、驅動版本、槽位信息、WWN、FC_ID、鏈路狀態及端口信息的查詢。

iSCSI

支持iSCSI的廠家、型號、固件版本、驅動版本、槽位信息、鏈路狀態、端口數量及配置信息的查詢。

NVMe

支持NVMe磁盤的廠家、型號、序列號、槽位信息、固件版本、驅動版本、硬盤狀態、接口類型、介質類型、容量、最大速率、協商速率、SMART等信息的查詢。

光模塊

支持光模塊基本信息顯示。包括如下信息:廠家名稱、廠家部件號、序列號、生產日期、光模塊類型(10GBASE_SR)、波長、多模/單模,溫度,電壓,功耗的門限。

支持光模塊診斷包括:光模塊Los檢測、溫度、電壓和功耗超過門限的檢測。

支持光模塊匹配檢測(類型匹配和速率匹配):iBMA上報光模塊類型和速率。

說明

只支持Linux系統。

OAM鏈路檢測

刀片服務器OAM(802.3ah)檢測,支持OAM鏈路故障檢測,包括鏈路狀態檢測(誤碼越限、誤幀越限或者誤幀秒越限)。

說明

只支持Linux系統,配合E9000交換單板。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章