[摘要]华为服务器POST阶段异常如何解决?北京华为服务器代理商告诉我们,请根据以下故障现象进行诊断。
POST阶段异常如何解决?告诉我们,请根据以下故障现象进行诊断。
-
现场具备通过日志或工具定位故障的条件时,北京华为服务器代理商建议参考“处理步骤”进行处理;现场需要快速恢复故障时,请参考“快速恢复方法”进行处理。
-
更多故障现象及解决方案北京华为服务器代理商建议参考华为智能计算产品案例查询助手。智能计算产品案例查询助手目前仅面向华为合作伙伴及华为工程师开放。
故障现象
|
处理步骤
|
快速恢复方法
|
待机不能上电(电源按钮指示灯黄色常亮)
|
-
收集iBMC日志,查询CPLD寄存器确认是否电源故障。
-
排查主板(集成CPU)和内存是否安装正确。
|
-
拆卸NIC、FC HBA卡等PCIe外部设备。查看故障是否解决。
-
仅保留服务器***小化配置,即仅保留单个CPU、主板和单根内存。查看故障是否解决。
-
排查CPU、主板和内存是否故障,确认故障部件后进行更换。
|
上电即掉电
|
-
收集iBMC日志,查询CPLD寄存器确认是否电源故障。
说明:
OS掉电后,先 进行BMC日志收集,不要拔出AC电源或进行重启操作,否则CPLD寄存器记录的故障信息bit位会被清除。
-
排查电源背板和主板是否存在故障。
|
-
检查外部供电环境是否正常,包括PDU或电源插排、电源模块和电源线。更换故障部件,查看故障是否解决。
-
更换主板或电源背板。
|
上电即no signal
|
-
收集iBMC日志,查询CPLD寄存器确认是否电源故障。
-
通过iBMC命令行开启BIOS全打印,重启服务器,保存系统串口打印日志,故障复现后收集iBMC日志、下载BIOS的BIN文件。
|
-
执行ipmcset -d clearcmos命令,清除CMOS,查看故障是否解决。
-
是,处理完毕。
-
否,执行。
须知:
执行ipmcset -d clearcmos命令会恢复BIOS默认配置,请谨慎执行此操作。
-
升级iBMC和BIOS。查看故障是否解决。
-
拆除PCIe卡、HBA卡等外部设备。查看故障是否解决。
-
仅保留服务器***小化配置,即仅保留单个CPU、主板和单根内存。查看故障是否解决。
-
排查CPU、主板和内存是否故障,确认故障部件后进行更换。
|
反复上下电
|
-
开启iBMC录屏。
-
通过iBMC命令行开启BIOS全打印,重启服务器,保存系统串口打印日志,故障复现后收集iBMC日志、下载BIOS的BIN文件。
-
恢复BIOS默认值,查看是否正常运行。
-
如果恢复BIOS默认值后恢复正常,业务侧根据实际应用修改BIOS相关参数。
-
如果恢复BIOS默认值后无效,则收集iBMC日志、下载BIOS的BIN文件,具体请参见对应版本的。
|
POST随机界面卡住
|
-
截图当前屏幕。
-
收集iBMC日志,查询CPLD寄存器,确认是否电源故障。
-
通过iBMC命令行开启BIOS全打印。
-
开启iBMC录屏,重启服务器,保存系统串口打印日志,故障复现后收集iBMC日志、下载BIOS的BIN文件。
-
排查USB外设、CPU、硬盘、内存、PCIe设备。
|
RAID自检卡住
|
-
将当前iBMC的KVM或本地KVM拍照保留。
-
收集iBMC日志。
|
-
如果存在RAID卡固件错误,更换RAID卡或电容。查看故障是否解决。
-
排查硬盘、硬盘背板或SAS线缆是否故障。
-
如果RAID组离线,则重新导入RAID组。查看故障是否解决。
-
如果电容电量为空,则根据界面提示,按相关按键使系统保持运行状态,上电约30分钟后观察电容状态。若电容显示异常,请更换电容。
|
网卡PXE失败
|
-
确认网卡是否支持PXE。
-
查看BIOS PXE配置、 确认网卡PXE功能是否启用。
-
排查网卡是否故障。
-
业务侧排查PXE网络环境。
|
根据处理步骤处理。
|