PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

HP ML310e Gen8 v2安装P420阵列卡开机启动后红屏报错!

[复制链接]
跳转到指定楼层
1#
红色狂想 发表于 2022-4-15 16:18 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
点击数:4245|回复数:5
手里有一台HP ProLiant ML310e Gen8 v2塔式服务器,最近买了一张全新的HP Smart Array P420/2GB FBWC 6Gb 2-ports Int SAS Controller  631671-B21阵列卡,今天收到货后马上安装到Slot 3槽里开机测试,结果进入第二个自检画面时就会红屏报错,提示信息是NMI Detected. Please consult the Integrated Management Log for more details

查看iLO4里的错误日志如下:
PCI Bus Error (Slot 0, Bus 0, Device 28, Function 4)
PCI Bus Error (Slot 3, Bus 0, Device 1, Function 1)
Unrecoverable System Error (NMI) has occurred.  System Firmware will log additional details in a separate IML entry if possible

其它三个Slot扩展槽是空着的,什么设备都没插,就Slot 3槽里之前插了一张LSI Logic SAS 1068E第三方品牌的阵列卡,使用也一切正常,现在拔除了这张卡换上P420开机就会红屏报错……
为什么会这样啊,HPE官网用户手册上写的HP ProLiant ML310e Gen8 v2配套选件是支持P420这款阵列卡的呀,难道是因为我选的是2GB FBWC缓存的,机器不支持?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
2#
固特异轮胎 发表于 2022-4-15 19:46 | 只看该作者
你怎么又买阵列卡
3#
红色狂想  楼主| 发表于 2022-4-22 16:53 | 只看该作者

主要是想玩儿一下RAID 5,不要给人生留下遗憾啊,而且P420这款卡的好处是可以进HPSSA管理软件随意切换RAID阵列模式和IT直通模式,价格也很便宜

但是没想到会红屏报错,换插槽,拔除所有系统内存只插一根4GB内存也不行。本来P420阵列卡就应该插在Slot 3槽里,HPE官方HP ProLiant ML310e Gen8 v2 Server - Option Parts页面中HP storage controllers一栏注明写道:NOTE: Smart Array Storage controller can be added only in PCIe Slot 3, Slot 4 or both.

HP ML310e Gen8 v2服务器主板上的所有固件也都更新到了最新版,又从抽屉里翻出来18年买的那张安高华LSI MegaRAID SAS 9260-8i阵列卡,同样插在Slot 3槽里就能正常使用,真是怪了

然后就在想,有没有可能是因为主板上有个集成的软阵列HP Dynamic Smart Array B120i Controller,如果不事先在BIOS里禁用屏蔽掉它,当安装P420独立硬阵列卡时就会发生冲突呢?
假设这个板载软阵列B120i位于总线Slot 0, Bus 0,那么这和以上iLO4 Integrated Management Log中显示的错误日志是吻合的吧
PCI Bus Error (Slot 0, Bus 0, Device 28, Function 4)
PCI Bus Error (Slot 3, Bus 0, Device 1, Function 1)
Unrecoverable System Error (NMI) has occurred.  System Firmware will log additional details in a separate IML entry if possible

于是进BIOS禁用了HP Smart Array B320i RAID Configuration,就是把板载磁盘控制器模式改成Enable SATA AHCI Support,然后又进USB Options禁用了USB Boot Support功能

再次插上那张P420,机器可以通过自检了,按F9进BIOS,在PCI IRQ Settings和PCI Device Enable Disable下也能看到HP Dynamic Smart Array P420 Controller,详见下图
但是在iLO4里面却看不到。。。然后我重启了一下,又出现红屏现象了。再次重启,又不红屏可以通过自检了。。。心想试试看能否进入配置管理软件,可当我打开HP Intelligent Provisioning后就直接黑屏报错了,错误提示信息如下:
[ 0.294670] NMI: PCI system error (SERR) for reason al on CPU 0.
[ 0.294670] memory parity errors detected, but trying to continue




实在没辙了,怀疑卡有问题,退货了

然后大前天逛闲鱼时看见一个卖P420+1GB缓存+电池的,才108元包顺丰,看卖家是专业销售二手服务器和板卡的,手里有设备,就顺便咨询了一下我这个红屏的问题,他说记得红屏好像是卡有故障。。。反正不试个究竟我是不会罢休的,于是就又买了一张,并让他给我测试好,将固件更新到8.0最新版
本来以为要在他的Gen8机架服务器上测试拍照给我看呢,他说不用那么麻烦,P420插普通PC上用HP官方工具就能刷固件,能刷,卡就是正常的

另外还向他求证了一下,Gen8服务器主板上集成的HP Dynamic Smart Array B120i Controller软阵列是否可以与P420共存一起使用。他说可以,只是软阵列性能太差,一般不会用它,但两者不会冲突。
担心对方不明白我的意思,晚上又询问了一遍,对方说我为什么重复询问,我是专业的,现场也给你看了
现在已经将ML310e Gen8 v2的BIOS恢复到出厂默认设置了,就等卡到手后上机测试了,希望这次能成功……

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
4#
eterfinity 发表于 2022-4-24 09:28 | 只看该作者
本帖最后由 eterfinity 于 2022-4-24 09:29 编辑

NMI紫屏是按到了物理NMI按钮, 或者iLO里虚拟按到了软件NMI按钮,或者硬件本身遇到类似的问题;NMI的作用是手工触发一个类似蓝屏的状态,用来DUMP内存,调试用;
放电RTC NVRAM,不行就别折腾了

5#
红色狂想  楼主| 发表于 2022-4-27 13:42 | 只看该作者
eterfinity 发表于 2022-4-24 09:28
NMI紫屏是按到了物理NMI按钮, 或者iLO里虚拟按到了软件NMI按钮,或者硬件本身遇到类似的问题;NMI的作用是 ...

NMI英文全称叫什么,这个物理按钮是在阵列卡上还是主板上,具体在哪个位置?给RTC NVRAM放电不就是取下主板上的电池,短接一下跳线,重置CMOS设置吗?
我Google搜了一下这个故障,发现国外也有很多Gen8、Gen9用户遇到这个NMI红屏问题,但没有一个最终的答案,有人说将主板从托盘上拆下,取下南桥散热片,把硅脂刮干净重新上硅脂,这样就好了……

不知道是什么原因,这段时间我特别背,先是闲鱼上买了个全新的P420红屏报错点不亮,然后又买了一个二手拆机的被暴力快递搞坏了,到手上机测试看不到卡,在iLO4里看不到,进BIOS也看不到,但卡上的指示灯亮着



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
6#
红色狂想  楼主| 发表于 2022-5-1 15:16 | 只看该作者
eterfinity 发表于 2022-4-24 09:28
NMI紫屏是按到了物理NMI按钮, 或者iLO里虚拟按到了软件NMI按钮,或者硬件本身遇到类似的问题;NMI的作用是 ...

问题解决了,看来是多花钱才行,在天猫上买了个P420+1GB缓存+电池267元包邮,卖家测试好发货,这次到手上机直接就点亮了,POST过程可以看到配置信息,进iLO也能看到,打开SSA配置管理也一切正常,与板载软阵列B120i完美共存
之前是因为图便宜买到了故障卡,如果卡正常的话开机就能听见硬盘磁头运动的声音,但之前那个装上后开机硬盘就没动静









本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部