PCEVA,PC绝对领域,探寻真正的电脑知识
12
返回列表 发新帖
开启左侧

Ryzen AVX高性能计算部分

[复制链接]
danze 发表于 2017-3-3 13:43 | 显示全部楼层
iu跑avx热不是因为256原生设计吧?   ivb跑起来也热的,觉得haswell的热是材料 fivr 物理布线等综合原因
究竟是128x2 还是256x1这种应该是黑箱问题,从外测试猜设计挺难的
chungexcy  楼主| 发表于 2017-3-3 14:35 | 显示全部楼层
本帖最后由 chungexcy 于 2017-3-3 14:39 编辑
danze 发表于 2017-3-3 13:43
iu跑avx热不是因为256原生设计吧?   ivb跑起来也热的,觉得haswell的热是材料 fivr 物理布线等综合原因
究竟 ...

avx确实热。我的5200u,双核2.5g,跑p95。sse模式12w,avx模式15w,fma模式18w。1.5倍的发热量摆在这了,散热速度和温差成正比,想不热都难。

至于是不是avx128,从cpu设计上讲,由于单核双线程,两个128位可以提升128位指令集的性能。而两个128位模拟256位,反而会比单个原生256单快,原因是cpu内部指令并行优化一般会比软件优化容易也更好。

Poyet1967 发表于 2017-3-3 14:56 | 显示全部楼层
我记得推土机系列有个FMA4,现在AMD是回到和intel一样的FMA3了?
danze 发表于 2017-3-3 16:52 | 显示全部楼层
本帖最后由 danze 于 2017-3-3 16:55 编辑
chungexcy 发表于 2017-3-3 14:35
avx确实热。我的5200u,双核2.5g,跑p95。sse模式12w,avx模式15w,fma模式18w。1.5倍的发热量摆在这了, ...

..实际状况又不会像示意图上那样多一个块就多个通路,实际它还是个黑盒 受调度 分派等影响流水跑测试究竟哪些子系统参与,fivr工况/效率  制程本身的电气特性变化之类    ff制程出来这么久,似乎就只听说过intel的积热难散  也许是材料    这些谁知道呢      

对比ivb和hsw,它们的sse avx(非2/fma)性能以及smt/旧sse差异不算很大,  应该说影响更多是来自乱序执行引擎资源和效率强化/缓存系统

zen也同理,毕竟"翻版haswell"

qsmcomp 发表于 2017-3-3 17:44 | 显示全部楼层
本帖最后由 qsmcomp 于 2017-3-3 22:05 编辑
royalk 发表于 2017-3-3 09:12
如果是兼容模式做到差15%的性能那也是不错了,但估计aida64缓存测不出…

我们看一下GCC的cpu定义吧。

以上是GCC 6.3的定义。

上面的定义指出,
Ryzen进行未对齐的AVX2存操作指令的时候有严重的性能惩罚;
Ryzen更喜欢AVX而非AVX2。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
OstCollector 发表于 2017-3-3 19:48 | 显示全部楼层
本帖最后由 OstCollector 于 2017-3-3 19:55 编辑
qsmcomp 发表于 2017-3-3 17:44
我们看一下GCC的cpu定义吧。

以上是GCC 6.3的定义。

好像刚好相反?
说起来,gentoo的stable好像还没到5……

qsmcomp 发表于 2017-3-3 20:35 | 显示全部楼层
OstCollector 发表于 2017-3-3 19:48
好像刚好相反?
说起来,gentoo的stable好像还没到5……

按照字面意思理解就行了。
OstCollector 发表于 2017-3-3 21:50 | 显示全部楼层
qsmcomp 发表于 2017-3-3 20:35
按照字面意思理解就行了。

注意有个取反,所以Zen的非对齐读取没啥问题,但是非对齐写入会有严重的性能损失

Sandybridge有读写性能损失,到了Ivy就没了
qsmcomp 发表于 2017-3-3 22:05 | 显示全部楼层
OstCollector 发表于 2017-3-3 21:50
注意有个取反,所以Zen的非对齐读取没啥问题,但是非对齐写入会有严重的性能损失

Sandybridge有读写性能 ...

多谢指正。
txgy 发表于 2017-3-4 00:05 | 显示全部楼层
chungexcy 发表于 2017-3-3 11:34
我觉得amd这步棋走得不错,放弃了原生256位带来的高功耗和高发热,用128位来兼容,然而还能把128位本身的 ...

最新版的LINX应该可以跑满AVX2
gk104_200 发表于 2017-3-4 13:04 | 显示全部楼层
实际上很多编译器还停在SSE上,服务器普遍用VM runtime更没需求了。AVX在现在没什么意义
az6338890 发表于 2017-3-4 21:20 | 显示全部楼层
原来skylake的15%是指这个
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部