PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

ESXi_6.5_U1 正常关机硬盘异常断电计数却增加!求分析… ...

[复制链接]
1#
eterfinity 发表于 2018-4-16 09:41 | 显示全部楼层
这个要看你硬盘接在哪个控制器上,如果是使用的第三方depot提供的sata-xahci驱动的控制器,那么就会这样。
如果是接在sashba卡或者阵列卡上,那么拍错的方向还要考虑3.3伏供电
2#
eterfinity 发表于 2018-4-16 16:36 | 显示全部楼层
100/200/c230系列芯片组的sata ahci控制器实际是驱动有问题,有一个偏方可以解决,就是让硬盘从pcie插槽取电,而不直接从电源取电。
3#
eterfinity 发表于 2018-4-16 17:37 | 显示全部楼层
GreatorK 发表于 2018-4-16 17:27
那有没有渠道去反馈这个BUG,或者是不是可以直接买一个兼容6.5的阵列卡解决问题? ...

参照vsan ready node里面使用板载c236 sata ahci控制器 的型号去注意它的主板电源就好了,或者随便搞个lsi的卡
4#
eterfinity 发表于 2018-4-16 22:21 | 显示全部楼层
GreatorK 发表于 2018-4-16 18:57
今天刚刚看到主板的兼容性列表里是兼容 ESXi_6.0_U1b 的,回去试下降到6.0看看,或者我能在6.5上跑6.0的HBA ...

用6.0的话,如果你的sata控制器硬件id是一下几个之一:
8086:8c82, 8086:8c83, 8086:9c02,8086:9c83, 8086:22a3, 8086:0f22, 8086:5ae3, 8086:a282
你需要
即使不是  你也可以装装试试。
要先 esxcli software acceptance set --level=CommunitySupported

用6.5或6.5u1, 如果你那套硬件不是品牌服务器的话,换个专业点的电源,或者把本地ssd标为“远程”



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
5#
eterfinity 发表于 2018-4-17 05:04 | 显示全部楼层
本帖最后由 eterfinity 于 2018-4-17 05:15 编辑
GreatorK 发表于 2018-4-16 23:52
用的是6.5U1,硬件ID是8086:a102,电源是益衡ENP-7025F的服务器TFX电源;我按这个帖子禁用了vmw_ahci驱动 ...

装个vcenter ,就有标为远程这个按钮了。此外,命令也好查的,我记得好像和强制设置为ssd是一条命令,只不过参数不是enable_ssd然后重点来了,8086.a102,是vmware的黑名单设备,具体为啥我不知道,你关闭主板vt-d或者启动参数加上noIOMMU试试。不改直通map文件的话,这个控制器和vtd有冲突。或者你改一下map,[size=43.5556px]Intel Corporation Sunrise Point-H AHCI ControllerThis needed addition of this line in /etc/vmware/passthrough.map
# INTEL Sunrise Point-H AHCI Controller
8086  a102  d3d0     false



6#
eterfinity 发表于 2018-4-19 14:21 | 显示全部楼层
本帖最后由 eterfinity 于 2018-4-19 14:47 编辑
GreatorK 发表于 2018-4-19 13:17
今天测试了昨天刚刚发布的 ESXi_6.7 ,问题依旧,这样看来从6.0一直到6.7我这个都有问题……我在官方社区 ...

我大概知道你的问题是啥了,建议你用u盘装esxi,安装盘引导后可直接选优盘,然后系统里设置把syslog和scratchlog放硬盘里。这样弄过后,再试试吧。我前面的回复你大概没理解,说白了就是供电问题。不信的话,你拿移动硬盘盒装200g固态盘再开机试试

这里不能用常识来判断.
供电\驱动\VT-D这三个东西怎么联系起来的呢?  
开关机的时候如果某个模块因为供电的原因, 导致当系统里开启ioMMU(vt-D)的时候无法正常发送关机信号给sata,那么就会是这样子的结果.
如果不开ioMMU,系统少加载一个模块,可能也就不出现这个故障了,
如果你把本地盘标为远程了,那么也会改变关机时的行为,所以也是有可能避免这个问题的,
但到底怎么样,要以实际情况为准.
或者使引导盘不放在出问题的链路上,比如放到usb上去,可能也就避免了.

知道为嘛esxi不支持intel ich内置的raid么,, 就是因为内置的sata raid实际上不带有lun mask功能,系统里实际上还是能看到raid成员的单个物理磁盘的,intel的驱动上又没有专门去分开物理盘与raid volume,导致esxi无法正确做关机时的断电顺序,所以干脆不支持.
即便是linux,  也要带参数屏蔽sata设备才行.



7#
eterfinity 发表于 2018-4-19 21:41 | 显示全部楼层
本帖最后由 eterfinity 于 2018-4-19 21:48 编辑
GreatorK 发表于 2018-4-19 15:43
大佬,首先这个供电是指BIOS层面还是直接硬件比如TFX电源或者主板啊,我倒是更新了最新的BIOS;另外这个模 ...

disable_local 是你自己发明的吧  老老实实装个VCSA, 然后在vsphere web client里面标为远程。

8#
eterfinity 发表于 2018-4-19 21:51 | 显示全部楼层
本帖最后由 eterfinity 于 2018-4-19 21:59 编辑
GreatorK 发表于 2018-4-19 21:45
他下边这个enable_ssd也不能执行啊……重点是是不是硬件有问题啊…… ...

esxcli storage nmp satp rule add -s VMW_SATP_XXXXXX --device naa.%%%%%%%%%%%%%%% --option=——————————————————

9#
eterfinity 发表于 2018-4-19 21:56 | 显示全部楼层
GreatorK 发表于 2018-4-19 15:43
大佬,首先这个供电是指BIOS层面还是直接硬件比如TFX电源或者主板啊,我倒是更新了最新的BIOS;另外这个模 ...

你的ESXi装进u盘 关闭vt-d之后   不要把T9接上去  把别的盘接T9的位置 看增加不

然后是电源问题  实际上  你怎么改主板电源管理都是没用的 ,只能是从pcie插槽取电试试看,或者除非一种特例:你的机器里有支持RDMA的网卡,那么运行中网卡使用过的话,关机会强制等网卡释放掉
10#
eterfinity 发表于 2018-4-19 22:00 | 显示全部楼层
GreatorK 发表于 2018-4-19 21:45
他下边这个enable_ssd也不能执行啊……重点是是不是硬件有问题啊…… ...

--option=enable_ssd
11#
eterfinity 发表于 2018-4-19 22:07 | 显示全部楼层
本帖最后由 eterfinity 于 2018-4-19 22:09 编辑

此外  美国人设计的板子

特别是带完整IPMI功能的,bios里都有个开关 , 就是powercycle的方式: 完整断电再通电,还是热重置。

而且特别脑残的是, 很多板子里它不给用户操作这个开关的权利。默认是自动。

您可能不幸中招, 如果中招,只能想办法让SSD的取电来源最后一个断电。

比如打开pcie网卡的网络唤醒,然后从pcie取电。
或者更极端的打开usb唤醒,从usb取电。

再复杂点的硬件  , 比如品牌的服务器主板bios, 一般会有这个powercycle mode的控制开关给用户自己去操作

然而我们实际工作中遇到的是,,某些高端CNA改任何参数,保存后不经历完整断电都可能会导致无法被驱动。

12#
eterfinity 发表于 2018-4-19 22:10 | 显示全部楼层
GreatorK 发表于 2018-4-19 22:04
别的盘接T9位置也会增加,网卡一个是210AT,一个是219LM,其中219LM用来做 Intel AMT 远程控制,改电源管 ...

T9上易驱线或盒子,,系统装里头,再试试T9 smart里断电还增加不
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部