PCEVA,PC绝对领域,探寻真正的电脑知识

标题: Ryzen和其他各种CPU线程调度实测 [打印本页]

作者: Mufasa    时间: 2017-3-8 13:26
标题: Ryzen和其他各种CPU线程调度实测
最近讨论比较热门的话题,Win10没有正确识别Ryzen的SMT设计,导致问题。

今天专门实测了一下,并且和其他CPU加以对比。

首先是Ryzen在Win10下的测试,FritzChess
8线程,15321
2线程,4545
线程分配无任何规律,16个核心胡乱分配。
我准备截图保存,但是死机了。。。。跑测试不死机,开个画图竟然死了。

Ryzen在Win7下的表现
首先说明,Win7把Ryzen识别为普通超线程CPU,使用SMT调度
SMT调度下,不能手动把Fritz的线程强行分配到同一个核心的两个超线程单元,会得到极端异常的结果(只有几百分)。
下面的测试都是2线程物理核心,恩,两个线程,方便分析。
自动,4919
手动分配到第一个CCX,4930
手动分配到第二个CCX,4945
手动把两个线程分别放在各自CCX,4895
反复测试多次,排除误差影响,数据可信。
第一个CCX成绩偏低是因为Win7系统自身的一些小任务会占用核心0 1 2 3,消耗少量内存带宽。
即使我手动分配在 4 5 6 7 ,也会影响性能。
跨CCX成绩最低,可见互联带宽确实不足,也可以说单个CCX内存带宽已经足够FritzChess使用。

双路Opteron 6276
Opteron 6276本身是胶水设计,每个封装内部有两个芯片。
两颗6276组成的系统,实际上是4颗Opteron MP通过HyperTransport互联,每个节点双通道内存,4节点,8通道内存,16模块,32核心。
Win7没有识别MP节点(4节点NUMA),但正确识别了模块化设计,按照SMT调度执行,避免同一个模块的两个核心同时加载。
自动,3424
手动分配在一个节点,3224
手动跨CPU封装,3439
我的分析是,单个节点内存带宽不足,影响了性能发挥,所以Win7不开启NUMA也是对的。
跨节点使用,虽然HyperTransport会造成延迟,但内存带宽提升带来的优势更大。

双路Xeon X5650
Win7针对这样的配置完全优化,同时开启NUMA和SMT调度,2节点,12核心,24线程。
有相关性的线程会被优先安排在同一个NUMA节点,避免QPI互联传输。
自动,4419
手动同NUMA节点,4514
手动异NUMA节点,4427
可见核心数量非常多以后,系统的自动调度并不能实现最佳性能,即使系统完全识别CPU并开启了对应策略,依旧不如手动固定核心运行。
自动调度会让线程频繁在核心之间切换,损失性能。

双路Xeon E5430
E5430是771时代的胶水CPU,系统结构非常复杂。
5100北桥芯片有两根1333MHz FSB分别连接到两个CPU封装。
每个CPU封装内部是两颗酷睿2芯片共享FSB,同芯片两个核心共享6MB二级缓存,每个封装2芯片4核心12MB二级缓存,整个系统8核心24MB二级缓存。
Win7对于这样的系统不会开启任何优化,因为它是UMA统一内存结构,也没有SMT。
自动,3895
手动分配在同芯片,3915
手动分配在同封装异芯片,3868
手动分配在异封装异芯片,3856
可见异封装异芯片的性能最低,这也很容易理解,因为互联数据需要绕道北桥芯片,延迟最高。

希望能够对各位分析Ryzen的线程分配与互联提供参考。


作者: lance    时间: 2017-3-8 13:46
看国外的论坛说,ryzen的内存频率和DF频率是2:1,高频内存会同步提升DF的频率。DF频率提升对Ryzen性能提升帮助很好。那有没有试把内存超到2666以上的性能
作者: nighttob    时间: 2017-3-8 14:14
涉及NUMA的话还得有NUMA调优的问题
这方面反而是咱们这种折腾DIY的比较讲究
见过不少买了4路E7的反而就只配一个内存板,本来E7的内存性能就惨
作者: 走刀口    时间: 2017-3-8 14:29
E5 2670的机器怎么不测试一下?

作者: 菲尼克斯    时间: 2017-3-8 14:40
奇怪老WIN7比较正常新系统WIN10反而有问题,等MS发补丁?
作者: lacsiess    时间: 2017-3-8 15:33
菲尼克斯 发表于 2017-3-8 14:40
奇怪老WIN7比较正常新系统WIN10反而有问题,等MS发补丁?

应该是农企补丁的补丁~~~这个调度问题十之八九出在农企以前对巨硬提交的推喵机调度补丁,打了这个补丁之后巨硬的新操作系统(NT6.2以后)会把农企K12以上的U每个线程都作为一个物理核心......现在农企就要把推喵机和ZEN区分开.
作者: yukari    时间: 2017-3-8 15:45
lacsiess 发表于 2017-3-8 15:33
应该是农企补丁的补丁~~~这个调度问题十之八九出在农企以前对巨硬提交的推喵机调度补丁,打了这个补丁之后 ...

或许直接把zen视为icpu就好了
作者: blackdove    时间: 2017-3-8 16:31
lacsiess 发表于 2017-3-8 15:33
应该是农企补丁的补丁~~~这个调度问题十之八九出在农企以前对巨硬提交的推喵机调度补丁,打了这个补丁之后 ...

没那么蠢吧,不判断pid产品型号只判断vid厂家代码就直接上补丁了?...临时工码农么。

作者: 暴疯狂笑    时间: 2017-3-8 16:55
目前只是表明Win7比Win10“正常”,不代表Win7就是完美支持。

感觉又回到以前AMD打双核补丁的时代了,也许下个版本的OS才能彻底配合好Ryzen。

作者: ly530408    时间: 2017-3-8 17:06
暴疯狂笑 发表于 2017-3-8 16:55
目前只是表明Win7比Win10“正常”,不代表Win7就是完美支持。

感觉又回到以前AMD打双核补丁的时代了,也许 ...

不需要下个OS估计4月份的windows 10的RTM版就可以解决。

作者: Mufasa    时间: 2017-3-8 20:14
nighttob 发表于 2017-3-8 14:14
涉及NUMA的话还得有NUMA调优的问题
这方面反而是咱们这种折腾DIY的比较讲究
见过不少买了4路E7的反而就只配 ...

以我的观察,大部分双路E5的服务器,实际也只插了2-4根内存。

2根就是每个CPU一根,4根就是每个CPU两根,都没有达到处理器内存带宽最优状态。

然而这些服务器都被用在了生产环境中。。。。

所以,内存带宽究竟能有多大实际影响,值得考虑。

作者: Mufasa    时间: 2017-3-8 20:27
E5 2670,同样两个线程

自动,4384
同NUMA节点,4576
异NUMA节点,4079

2670的成绩变动比预期的大,可能是我同时开了窗口在看网页的原因。
作者: bdzyq    时间: 2017-3-8 20:34
Mufasa 发表于 2017-3-8 20:14
以我的观察,大部分双路E5的服务器,实际也只插了2-4根内存。

2根就是每个CPU一根,4根就是每个CPU两根 ...

主要还是看业务类型。看对内存带宽敏感不

作者: Mufasa    时间: 2017-3-8 20:35
暴疯狂笑 发表于 2017-3-8 16:55
目前只是表明Win7比Win10“正常”,不代表Win7就是完美支持。

感觉又回到以前AMD打双核补丁的时代了,也许 ...

Win7这个算是运气好,没有特别优化,反而正好合适。

Win10,就看4月版本了。
如果优化得力,Ryzen性能可以大幅提升。
如果依旧优化不到位,参考当年推土机的待遇。。。。到最终也没真正优化。

Win7把推土机当作SMT调度,模块资源争抢问题倒是解决了。
但推土机当时设计的设想,高相关性线程共享L2,却被废弃了。

后来AMD给Win10弄的优化,又变成了全部当作物理核心对待。
然后给自己家的Ryzen挖了个坑。。。。

作者: 佐东贤    时间: 2017-3-8 20:38
进来看看大家的评论。
作者: overthink    时间: 2017-3-8 20:44
线程调度实测,有不同CPU测试,不同操作系统测试,数据翔实,有较大的参考价值。二级精华 @石头
作者: hokimfong    时间: 2017-3-8 21:13
持续观望吧!!~!AMD别这样就又倒下去了!!!

微软的win10,说起都是泪!!
作者: nighttob    时间: 2017-3-8 21:16
Mufasa 发表于 2017-3-8 20:14
以我的观察,大部分双路E5的服务器,实际也只插了2-4根内存。

2根就是每个CPU一根,4根就是每个CPU两根 ...

这些服务器需求的都不是性能
只要你别宕别整天报错就没人管

作者: bigww    时间: 2017-3-8 21:27
说白了就是,现在用ZEN的还是考虑WIN7咯。。。不过现在也没免费的WIN10升级了吧。。。看来我换电脑又要用回WIN7了。。。
已经习惯1年多的WIN10又要88了。。
作者: Mufasa    时间: 2017-3-8 21:30
bigww 发表于 2017-3-8 21:27
说白了就是,现在用ZEN的还是考虑WIN7咯。。。不过现在也没免费的WIN10升级了吧。。。看来我换电脑又要用回 ...

等4月新补丁啊,据说解决问题,性能提升。
作者: bigww    时间: 2017-3-8 21:59
Mufasa 发表于 2017-3-8 21:30
等4月新补丁啊,据说解决问题,性能提升。

感谢狮大的各种测试啊。。。我可以安心持币等一段时间了。。。
作者: Apache    时间: 2017-3-8 22:37
Mufasa 发表于 2017-3-8 21:30
等4月新补丁啊,据说解决问题,性能提升。

AMD的两个ccx之间交换设计没硬伤吗?


作者: Mufasa    时间: 2017-3-8 22:47
Apache 发表于 2017-3-8 22:37
AMD的两个ccx之间交换设计没硬伤吗?

我觉得没问题,满足正常的需要即可。

带宽做高了必然面临功耗增加一类的问题,得不偿失。

作者: DoctorX99    时间: 2017-3-8 22:51
Apache 发表于 2017-3-8 22:37
AMD的两个ccx之间交换设计没硬伤吗?

纠结这个没意思吧?除非延迟比I双路还高

作者: 暴疯狂笑    时间: 2017-3-8 23:04
bigww 发表于 2017-3-8 21:27
说白了就是,现在用ZEN的还是考虑WIN7咯。。。不过现在也没免费的WIN10升级了吧。。。看来我换电脑又要用回 ...

https://www.microsoft.com/zh-cn/accessibility/windows10upgrade

作者: qsmcomp    时间: 2017-3-8 23:15
blackdove 发表于 2017-3-8 16:31
没那么蠢吧,不判断pid产品型号只判断vid厂家代码就直接上补丁了?...临时工码农么。
...

推喵机都是15h家族,而Ryzen是17h。巨硬可能把17h视作15h的延续了。



作者: qsmcomp    时间: 2017-3-8 23:16
nighttob 发表于 2017-3-8 21:16
这些服务器需求的都不是性能
只要你别宕别整天报错就没人管

内存插得越多越容易Boom。
如果每根内存的故障率都一样的话。

作者: wsy2220    时间: 2017-3-9 00:46
Mufasa 发表于 2017-3-8 20:14
以我的观察,大部分双路E5的服务器,实际也只插了2-4根内存。

2根就是每个CPU一根,4根就是每个CPU两根 ...

这类应用单机性能差几个百分点不是太重要

作者: 武英仲    时间: 2017-3-9 09:33
玩游戏别突然给我来个卡顿就行
作者: jon722    时间: 2017-3-9 10:51
菲尼克斯 发表于 2017-3-8 14:40
奇怪老WIN7比较正常新系统WIN10反而有问题,等MS发补丁?

正常啊,W7毕竟好几年了,经过好几年的经历,早就趋于完美。而W10不过是商家利益最大化后急于推出的结果,没有几年的沉淀是不会稳定的。

作者: jon722    时间: 2017-3-9 10:59
bigww 发表于 2017-3-8 21:27
说白了就是,现在用ZEN的还是考虑WIN7咯。。。不过现在也没免费的WIN10升级了吧。。。看来我换电脑又要用回 ...

W10最早的免费我就注册了一个账号,并安装运行了十天左右,其他可以忍受,但是输入法无论如何都忍受不了,因为无论使用系统自带的还是安装的第三方输入法,都不能自设输入法切换的按键,这样玩起游戏来,不定时的出现问题(因为切换中英文的按键只有一个,这就导致了只要在游戏中使用加速键奔跑、滑行,就会出现中英文切换,烦透了)。

作者: zsbstephen    时间: 2017-3-9 12:18
提示: 作者被禁止或删除 内容自动屏蔽
作者: 九区至尊    时间: 2017-3-9 23:10
我感觉,AMD估计要跟以前一样,出一个CPU的系统补丁包来解决这些问题。。。。。
作者: gk104_200    时间: 2017-3-12 10:37
jon722 发表于 2017-3-9 10:59
W10最早的免费我就注册了一个账号,并安装运行了十天左右,其他可以忍受,但是输入法无论如何都忍受不了 ...

不是和linux的一样是win加空格吗

作者: bigww    时间: 2017-3-12 12:15
gk104_200 发表于 2017-3-12 10:37
不是和linux的一样是win加空格吗

WIN10延续了WIN8没有默认的中文美式键盘。






欢迎光临 PCEVA,PC绝对领域,探寻真正的电脑知识 (https://bbs.pceva.com.cn/) Powered by Discuz! X3.2