PCEVA,PC绝对领域,探寻真正的电脑知识
开启左侧

ESXi_6.5_U1 正常关机硬盘异常断电计数却增加!求分析… ...

[复制链接]
GreatorK 发表于 2018-4-15 21:28 | 显示全部楼层 |阅读模式
点击数:720|回复数:37
本帖最后由 GreatorK 于 2018-4-16 11:34 编辑

大家好!前两天在论坛求推荐硬盘结果今天又来找大家帮忙了……真是一波未平一波又起……

就是今天刚换上新硬盘发现一个很奇怪的问题,搜了很多地方也没有资料,所以跟大家说下看看能不能帮忙分析下,先感谢各位了!

先说一下硬件环境哈:

主板:超微X11SAE-M  C236 芯片组
CPU: E3-1268L V5 4C8T 2.4GHz
内存:Kingston 8GB ECC x2
硬盘:1.Liteon T9 200G 论坛定制版
         2.三星 SM863 480G

问题:ESXi主机正常关机情况下,三星固态硬盘的SMART里异常断电计数(EB)会增加,关机一次加一,定制版没有计数所以暂时还不清楚,这好像是没有发送ATA指令就突然断电,但是Windows Server 2012 R2环境下问题不存在,所以排除硬件问题;VMware官方论坛有人说是ESXi不兼容这盘,但是查过VMware官方兼容性列表,这个型号的硬盘及固件在兼容之列,所以这是ESXi的BUG?有没有什么办法解决一下……
刚刚加了一块机械硬盘也是这样,关机一次异常断电一次,大家有的话也可以看一下自己的ESXi系统啊……感觉这个问题其实挺大的……
还有一个帖子(这里这里)也说过类似情况但是没有后文了,各位看看有木有遇到过啊……
更新:今天查了一下官方的兼容列表,这个三星SSD包括固件C236的HBA控制器都是官方兼容的,所以这是一个驱动或者ESXi BUG?各位要不要看下自己的6.5u1主机……








本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
Tech 发表于 2018-4-15 23:38 | 显示全部楼层
这个又不影响,应该是esxi问题
来自苹果客户端来自苹果客户端
GreatorK  楼主| 发表于 2018-4-15 23:52 | 显示全部楼层
Tech 发表于 2018-4-15 23:38
这个又不影响,应该是esxi问题

对于SM863,看过三星的说明,这个计数加一意味着下次启动硬盘主控需要对数据表啥的进行一次恢复,这个还是有点担心数据的;另外这个在机械盘上来讲应该就是像突然断电那种机械结构的伤害吧,虽然不知道现在的技术来讲这种伤害可不可以忽略不计……
nighttob 发表于 2018-4-15 23:55 | 显示全部楼层
你自己都意识到了是没有发送命令所以出的问题
当然得去找磁盘控制器的问题

而且我也想不出ESXi有什么理由除了意外停电以外需要关机的
就算是例行维护,也是几个月才会有一次
所以我不觉得个位数的意外断电是个问题
eterfinity 发表于 2018-4-16 09:41 | 显示全部楼层
这个要看你硬盘接在哪个控制器上,如果是使用的第三方depot提供的sata-xahci驱动的控制器,那么就会这样。
如果是接在sashba卡或者阵列卡上,那么拍错的方向还要考虑3.3伏供电
GreatorK  楼主| 发表于 2018-4-16 09:46 | 显示全部楼层
nighttob 发表于 2018-4-15 23:55
你自己都意识到了是没有发送命令所以出的问题
当然得去找磁盘控制器的问题

硬盘是直接插到主板SATA接口的,所以控制器是主板芯片组的呀,我没有加阵列卡,学生党住寝室,所以每天晚上都得关机,学校限电……
GreatorK  楼主| 发表于 2018-4-16 09:47 | 显示全部楼层
eterfinity 发表于 2018-4-16 09:41
这个要看你硬盘接在哪个控制器上,如果是使用的第三方depot提供的sata-xahci驱动的控制器,那么就会这样。
...

C236主板自带的控制器会有这种问题吗?还是我BIOS里边有需要调整的?
GreatorK  楼主| 发表于 2018-4-16 10:47 | 显示全部楼层
eterfinity 发表于 2018-4-16 09:41
这个要看你硬盘接在哪个控制器上,如果是使用的第三方depot提供的sata-xahci驱动的控制器,那么就会这样。
...

刚刚查过VMware兼容列表,这个控制器在兼容之列而且加载的驱动也是对的,驱动BUG?
DoctorX99 发表于 2018-4-16 13:25 | 显示全部楼层
有没有尝试6.0版本的ESXI?之前Gen10有在用ESXI,没注意这个问题,现在用ClearOS,没法帮忙看了
来自安卓客户端来自安卓客户端
GreatorK  楼主| 发表于 2018-4-16 13:45 | 显示全部楼层
DoctorX99 发表于 2018-4-16 13:25
有没有尝试6.0版本的ESXI?之前Gen10有在用ESXI,没注意这个问题,现在用ClearOS,没法帮忙看了
...

VMware官方兼容列表里,C236的HBA控制器是不兼容6.0的,只兼容6.5和6.5U1……不过还是感谢!
XXHJACK 发表于 2018-4-16 15:28 | 显示全部楼层
不用分析了要么你升级到高版本的6.5要么降级到高版本的6.0!因为6.5不稳定。我们上虚拟化环境的时候差点被6.5搞死!
eterfinity 发表于 2018-4-16 16:36 | 显示全部楼层
100/200/c230系列芯片组的sata ahci控制器实际是驱动有问题,有一个偏方可以解决,就是让硬盘从pcie插槽取电,而不直接从电源取电。
GreatorK  楼主| 发表于 2018-4-16 17:18 | 显示全部楼层
XXHJACK 发表于 2018-4-16 15:28
不用分析了要么你升级到高版本的6.5要么降级到高版本的6.0!因为6.5不稳定。我们上虚拟化环境的时候差点被6 ...

我用的就是6.5_Update1啊,难道还有更新的?
GreatorK  楼主| 发表于 2018-4-16 17:27 | 显示全部楼层
eterfinity 发表于 2018-4-16 16:36
100/200/c230系列芯片组的sata ahci控制器实际是驱动有问题,有一个偏方可以解决,就是让硬盘从pcie插槽取 ...

那有没有渠道去反馈这个BUG,或者是不是可以直接买一个兼容6.5的阵列卡解决问题?
eterfinity 发表于 2018-4-16 17:37 | 显示全部楼层
GreatorK 发表于 2018-4-16 17:27
那有没有渠道去反馈这个BUG,或者是不是可以直接买一个兼容6.5的阵列卡解决问题? ...

参照vsan ready node里面使用板载c236 sata ahci控制器 的型号去注意它的主板电源就好了,或者随便搞个lsi的卡
GreatorK  楼主| 发表于 2018-4-16 18:01 | 显示全部楼层
eterfinity 发表于 2018-4-16 17:37
参照vsan ready node里面使用板载c236 sata ahci控制器 的型号去注意它的主板电源就好了,或者随便搞个lsi ...

暂时不想再购置新硬件了……所以VSAN READY NODE是指它的文档吗?再者,这个驱动更新应该能解决问题的吧,是以新版本ESXi的形式发布还是会有单独的VIB包提供下载啊?虚拟化新人,感谢前辈赐教!
Tech 发表于 2018-4-16 18:12 | 显示全部楼层
GreatorK 发表于 2018-4-15 23:52
对于SM863,看过三星的说明,这个计数加一意味着下次启动硬盘主控需要对数据表啥的进行一次恢复,这个还 ...

ESXi我都成年不关机的,停电,维护设备除外。
GreatorK  楼主| 发表于 2018-4-16 18:57 | 显示全部楼层
本帖最后由 GreatorK 于 2018-4-16 19:11 编辑

今天刚刚看到主板的兼容性列表里是兼容 ESXi_6.0_U1b 的,回去试下降到6.0看看,或者我能在6.5上跑6.0的HBA驱动吗@eterfinity ……
XXHJACK 发表于 2018-4-16 22:12 | 显示全部楼层
本帖最后由 XXHJACK 于 2018-4-16 22:14 编辑
GreatorK 发表于 2018-4-16 17:18
我用的就是6.5_Update1啊,难道还有更新的?

没注意,不过最近肯定要出,就是去年8月部署这个6.5u1版本搞死我了,我以为是硬件问题,结果是6.5本身问题。驱动大版本号理论兼容..................
eterfinity 发表于 2018-4-16 22:21 | 显示全部楼层
GreatorK 发表于 2018-4-16 18:57
今天刚刚看到主板的兼容性列表里是兼容 ESXi_6.0_U1b 的,回去试下降到6.0看看,或者我能在6.5上跑6.0的HBA ...

用6.0的话,如果你的sata控制器硬件id是一下几个之一:
8086:8c82, 8086:8c83, 8086:9c02,8086:9c83, 8086:22a3, 8086:0f22, 8086:5ae3, 8086:a282
你需要
即使不是  你也可以装装试试。
要先 esxcli software acceptance set --level=CommunitySupported

用6.5或6.5u1, 如果你那套硬件不是品牌服务器的话,换个专业点的电源,或者把本地ssd标为“远程”



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部