2288H v5伺服器安裝Windows系統後,PCI數據捕獲和信號處理控制器 出現感嘆號 可以在IBMC界面的“診斷-黑匣子” 關閉黑匣子功能,然後重啟設備解決 也可以通過在操作系統側安裝IBMA軟體解決 ...
2288H v5伺服器安裝Windows系統後,PCI數據捕獲和信號處理控制器 出現感嘆號
解決方案:
1、可以在IBMC界面的“診斷-黑匣子” 關閉黑匣子功能,然後重啟設備
2、可以在操作系統側安裝IBMA軟體
軟體下載鏈接:https://support.xfusion.com/support/#/zh/server-management-software/ibma-pid-21099187/software
安裝手冊:https://support.xfusion.com/support/#/zh/server-management-software/ibma-pid-21099187/document
上述任意操作後問題解決:
註意:iBMA安裝時需要完全解壓,不能在壓縮包內執行,否則出現“版本10.0.x.xxx不支持”。
iBMA可以支持伺服器CPU、記憶體、硬碟、網卡、IB卡、PCIe、RAID卡、光模塊等各個組件的狀態監控、性能監控、事件監控。
iBMA同時提供了黑匣子功能,開啟黑匣子功能後,能記錄系統發生異常宕機時的狀態信息和調試信息,可以輔助異常定位。iBMA提供了事件上報功能,iBMA周期性檢測物理盤、邏輯盤、RAID控制器等狀態變化事件,有事件變化情況下通過Redfish事件訂閱介面上報事件信息到上層管理軟體。
用戶在系統上安裝iBMA軟體後,iBMA提供的主要功能如表示。
功能 |
介紹 |
系統信息獲取 |
將操作系統、網卡、IB卡、硬碟、RAID卡等信息提供給iBMC。 |
文件上傳 |
支持esight和其它工具通過iBMC的Redfish介面將文件上傳至iBMA運行的伺服器,詳細請參考伺服器 iBMC Redfish 介面說明。 |
驅動升級 |
支持eSight和其他工具通過iBMC的Redfish介面進行驅動升級,詳細請參考伺服器 iBMC Redfish 介面說明。 說明 l 進行驅動升級前需中斷業務。 l 升級過程中不允許對系統進行下電、複位等操作。 |
系統狀態監控 |
定時監控系統信息和健康狀態的變化情況,用於上報給iBMC進行告警。 |
軟體管理 |
支持FusionDirector和其他工具通過iBMC的Redfish介面進行軟體的查詢、安裝、升級操作。 |
BOB |
l BOB是一個幫助帶內網路遠端主機通過帶內組網與本機iBMC進行通信的轉發工具。包括服務連接,如SSH、IPMI、HTTPS等;事件上報,如SNMP Trap等。 l BOB支持服務管理(啟動/停止/重啟),不支持獨立部署和工作。 l BOB提供了一個命令行bobCmd,用於啟動/停止/重啟BOB服務以及其他相關配置,轉發配置支持線上配置,無需重啟服務。配置支持持久化,即重啟系統後不會丟失。 |
iBMC事件轉儲 |
Linux/Windows系統上支持將iBMC事件轉儲至系統日誌文件中。 說明 對於版本號為Vxxx格式的iBMC,需要配套V294及以上版本;對於版本號為x.xx.xx.xx格式的iBMC,需要配套3.01.00.00及以上版本。 |
Redfish服務相容HTTPS協議 |
Redfish服務支持以HTTPS或HTTP協議啟動。 說明 l 對於版本號為Vxxx格式的iBMC,需要配套V316及以上版本,如果是V316之前版本,配置成以HTTPS協議啟動Redfish服務,則無法與iBMC通信;對於版本號為x.xx.xx.xx格式的iBMC,需要配套3.01.00.00及以上版本。 l iBMA支持HTTP和HTTPS兩種協議,HTTP協議明文傳輸,安全性較差;HTTPS協議密文傳輸,安全性較高。 |
網卡配置追溯 |
Linux系統支持周期性記錄網卡配置信息。 說明 在Linux系統下,iBMA會定時收集網卡的ethtool最新配置信息,文件存儲在iBMA安裝目錄的log/ethtool_log目錄下,可以使用FusionServer Tools在收集操作系統日誌時一併收集。 |
網卡故障檢測 |
l Linux系統支持Mellanox網卡的internal error檢測,並記錄在iBMA安裝目錄的log/common.log日誌中。 說明 需配套Mellanox網卡4.2及之後的驅動版本。 l VMware系統支持檢測網口狀態短時間變化事件並上報更新給iBMC。 |
存儲診斷 |
定時監控硬碟IO性能降低、硬碟Sense Code錯誤和文件系統只讀的存儲診斷信息並上報給iBMC。支持RAID卡下硬碟日誌的收集,用於硬碟耗損分析。 說明 l 硬碟IO性能降低和文件系統只讀檢測只支持Linux系統。 l 硬碟Sense Code錯誤檢測支持Linux系統、ESXi 6.5及以上版本。 |
記憶體隔離 |
支持對操作系統出現故障的物理記憶體頁,通過Redfish介面進行軟隔離操作。 說明 l FusionServer伺服器上iBMA支持記憶體隔離的操作系統為:Redhat 7.3、Redhat 7.4、Redhat 7.5、Redhat 7.6 、CentOS 7.3、CentOS 7.4、CentOS 7.5、CentOS 7.6、CentOS 7.7、CentOS 7.8、CentOS 7.9、CentOS 8.0、CentOS 8.1、CentOS 8.2、CentOS 8.3、EulerOS 2.0 SP3、EulerOS 2.0 SP5和EulerOS 2.0 SP9系統。 |
iBMC通過iBMA的RESTful介面可實現伺服器系統信息的查詢功能,如表所示。
組件 |
描述 |
操作系統 |
查詢OS的基本信息,包括主機名稱、描述、OS的版本(主版本、子版本及補丁主版本及子版本)、內核版本、廠商、系統時間等。 |
CPU |
查詢CPU的基本信息,包括系統CPU占用率及CPU的個數,型號,單個CPU占用率等CPU信息。 |
GPU |
查詢GPU的基本信息,包括GPU利用率和GPU記憶體使用率。 |
NPU |
查詢NPU的基本信息,包括記憶體資源使用率、HBM資源使用率、記憶體帶寬資源使用率、HBM帶寬資源使用率、AiCore資源使用率、AiCpu資源使用率、CtrlCpu資源使用率。 |
記憶體 |
查詢記憶體基本信息,包括查詢系統的記憶體大小及占用率。 |
網口 |
查詢網卡個數、規格速率、Link狀態、OAM狀態、雙工模式、固件版本、驅動名、網卡驅動版本、槽位信息、PCI-E設備號、功能號、網口名、網口IP、掩碼、網關、MAC地址、VLAN信息、收發包統計等,同時支持系統VLAN、Team及Bridge信息的查詢。 |
查詢物理網口的速率,當前占用率。 |
|
IB卡 |
查詢IB卡個數、晶元型號、固件版本、驅動名、驅動版本、槽位信息、PCI-E設備號、UUID、網口類型、設備類型、功能號的全球唯一標識、全球唯一標識、預設gid、埠lid、SM lid、選路掩碼、埠類型、能力地圖、網口名、網口IP、掩碼、網關、MAC地址、規格速率、Link狀態、雙工模式、自協商模式、MTU大小等信息。 說明 只支持Linux系統。 |
硬碟 |
查詢物理硬碟個數、廠商、類型、固件版本、序列號、容量、轉速、介面速率、物理槽位、硬碟絲印等信息查詢。 |
查詢物理硬碟狀態(ONLINE/OFFLINE)、溫度、運行時長、巡檢狀態、重構狀態/進度、SMART信息等。 |
|
查詢系統下邏輯盤的容量,已使用大小,使用率等信息。 |
|
RAID |
支持主流RAID卡,支持伺服器有多RAID卡場景。 |
查詢RAID卡個數、控制器型號、固件版本、驅動版本、槽位信息、條帶深度、Memory大小、ECC計數等。 |
|
查詢RAID電池健康狀態、電池類型、名稱、序列號、額定容量、電壓、當前容量、電壓、充放電次數、溫度等信息。 |
|
查詢RAID邏輯盤的RAID級別信息、正常/降級/離線狀態,獲取RAID組配置狀態,獲取RAID組中的硬碟物理槽位信息,獲取操作系統盤符與RAID組的關係、支持RAID組條帶寬度、訪問策略、讀寫策略、邏輯盤Cache狀態及是否為啟動盤等信息。 |
|
查詢RAID卡鏈路誤碼,硬碟背板鏈路誤碼。 |
|
FC/FCoE |
支持FC/FCoE卡的廠家、型號、固件版本、驅動版本、槽位信息、WWN、FC_ID、鏈路狀態及埠信息的查詢。 |
iSCSI |
支持iSCSI的廠家、型號、固件版本、驅動版本、槽位信息、鏈路狀態、埠數量及配置信息的查詢。 |
NVMe |
支持NVMe磁碟的廠家、型號、序列號、槽位信息、固件版本、驅動版本、硬碟狀態、介面類型、介質類型、容量、最大速率、協商速率、SMART等信息的查詢。 |
光模塊 |
支持光模塊基本信息顯示。包括如下信息:廠家名稱、廠家部件號、序列號、生產日期、光模塊類型(10GBASE_SR)、波長、多模/單模,溫度,電壓,功耗的門限。 支持光模塊診斷包括:光模塊Los檢測、溫度、電壓和功耗超過門限的檢測。 支持光模塊匹配檢測(類型匹配和速率匹配):iBMA上報光模塊類型和速率。 說明 只支持Linux系統。 |
OAM鏈路檢測 |
刀片伺服器OAM(802.3ah)檢測,支持OAM鏈路故障檢測,包括鏈路狀態檢測(誤碼越限、誤幀越限或者誤幀秒越限)。 說明 只支持Linux系統,配合E9000交換單板。 |
本文來自博客園,作者:古道輕風,轉載請註明原文鏈接:https://www.cnblogs.com/88223100/p/2288H_v5_PCI_ERROR.html