一张主板两个架构 Intel Core i9 7900X与Core i7 7740X评测

chungexcy · 发表于 2017-7-12 12:02

royalk 发表于 2017-7-12 11:41
这么说，Xeon是区分AVX512指令集直接限死频率？不是看TDP的么？那就亏大了。。如果是y-cruncher那样的TDP ...

我看intel说，linpack跑avx2都能稳定在2.5g，那么合理猜测，别的avx2程序至少能到2.7-2.8g。
如果这ppt功耗属实的话，我感觉intel的频率太保守了。base完全可以直接拿各种指令集的linpack频率-0.1/0.2g来定，相当于超线程的linpack烤机。
我那个2683v3，跑28线程linpack，频率刚好稳定在2.0g，功耗120wTDP，这款avx的base是1.9g。

linpack是双精度科学计算用的。waifu2x跑的是单精度，确实应该就是1000gflops，你那6950x@4g应该是一个性能，可能还更高点？
要是真是4组avx256，我估计就能到2000了。。。

只能支持avx2的linx老版本，我记得是有的，我论坛去找一下。

royalk · 发表于 2017-7-12 12:06

chungexcy 发表于 2017-7-12 12:02
我看intel说，linpack跑avx2都能稳定在2.5g，那么合理猜测，别的avx2程序至少能到2.7-2.8g。
如果这ppt功 ...

是的，这样比较合理，但如果涉及到AVX512就强制offset的话，那就不科学了。

linx刚跑了下0.65的，关到4C8T，同样4G比6700K还慢。。

gtx9 · 发表于 2017-7-12 12:10

royalk 发表于 2017-7-12 12:02
这个是跑128bit的吧。。AMD两个128刚好用完，Intel的2个256加1个512当3个128用

256bit啊。。。AVX的FP就已经是256了

royalk · 发表于 2017-7-12 12:12

gtx9 发表于 2017-7-12 12:10
256bit啊。。。AVX的FP就已经是256了

AVX2.0才是256，1.0是128，Ryzen架构就是2个128bit的AVX复用来跑256的

gtx9 · 发表于 2017-7-12 12:18

royalk 发表于 2017-7-12 12:12
AVX2.0才是256，1.0是128，Ryzen架构就是2个128bit的AVX复用来跑256的

AVX2只是把整数也改成256吧。。。

gtx9 · 发表于 2017-7-12 12:19

AVX是浮点256，整数128
AVX2是双256
AVX512就是双512.。。。

royalk · 发表于 2017-7-12 12:21

gtx9 发表于 2017-7-12 12:18
AVX2只是把整数也改成256吧。。。

那么ryzen架构只有一个256，而SKL-SP有3个，哪怕频率低核心少，也不可能算不过AMD啊

gtx9 · 发表于 2017-7-12 12:31

royalk 发表于 2017-7-12 12:21
那么ryzen架构只有一个256，而SKL-SP有3个，哪怕频率低核心少，也不可能算不过AMD啊
...

可能是EPYC的8通道内存功劳吧

POV-Ray is known to run mostly out of the L2-cache, so the massive DRAM bandwidth of the EPYC CPU does not play a role here. Nevertheless, the EPYC CPU performance is pretty stunning: about 16% faster than Intel's Xeon 8176. But what if AVX and DRAM access come in to play? Let us check out NAMD.

已经用上ICC编译器了

For our first shot with this benchmark, we used version 2.10 to be able to compare to our older data set. Version 2.12 seems to make better use of "Intel's compiler vectorization and auto-dispatch has improved performance for Intel processors supporting AVX instructions". So let's try again:

chungexcy · 发表于 2017-7-12 12:31

本帖最后由 chungexcy 于 2017-7-12 12:33 编辑

gtx9 发表于 2017-7-12 12:19
AVX是浮点256，整数128
AVX2是双256
AVX512就是双512.。。。

amd就俩fma128单元。一个fma单元，可以做add，可以做mul，也可以一步做mul+add。
只不过AMD合起来用效率挺高的，所以即使浮点、整数都能吊打sandy bridge那个架构。

sandy bridge：俩浮点avx256单元，不支持fma；整数依然用sse
haswell：俩fma256单元，浮点性能由于支持fma了翻倍；整数支持原生256，性能提升不到一倍。
skylake：俩fma512单元，感觉单元有改进（个人看法）。浮点性能略有提升3%；整数性能提升15%。
Skylake-sp：理论性能翻倍，实际效率捉鸡

txgy · 发表于 2017-7-12 12:34

skylake是两个fma512单元？

haomingci3 · 发表于 2017-7-12 12:45

本帖最后由 haomingci3 于 2017-7-12 12:47 编辑

gtx9 发表于 2017-7-12 12:19
AVX是浮点256，整数128
AVX2是双256
AVX512就是双512.。。。

AVX的浮点256不是FMA256，haswell的两个FMA256比SNB的一个MUL256+一个ADD256的性能翻倍（SNB是256位浮点没错，但不是FMA只相当于一半性能），而ryzen是两个FMA128，等效一个FMA256。
ryzen的AVX指令算力与SNB伯仲之间，FMA加持可能略强SNB一点，和haswell、skylake差不多
ryzen的AVX2指令算力不如HW，SKL

chungexcy · 发表于 2017-7-12 13:00

本帖最后由 chungexcy 于 2017-7-12 13:06 编辑

royalk 发表于 2017-7-12 12:06
是的，这样比较合理，但如果涉及到AVX512就强制offset的话，那就不科学了。

linx刚跑了下0.65的，关到4C ...

LinX_v0.6.8_(11.3.3.010).zip

mkl 2017大版本的上一个11.3 update 3。
最后的修订版本是11.3.4，不过到处都找不到。

haomingci3 · 发表于 2017-7-12 13:08

R大试试看过不同的指令的P95X64看看有什么不同，p95 26.6.3应该是SSE最热（der8auer超5G应该过的是这个），27.9是AVX最热，28.10是AVX2最热

ydjj · 发表于 2017-7-12 13:36

我感觉现在整个skylake-SP都要成为AVX512的踏路石
不实际上AVX512看看疗效根本没法优化，一直纸上谈兵总得拉出来溜
第一次上AVX512各种高代价，优化也还没开始，明年的cannonlake-SP可能才能开始真正发挥威力
AVX2也优化了好几代
大家一起战未来

爱吟诗坦 · 发表于 2017-7-12 13:58

7740X这款产品真是尴尬，用X299平台但用不上这主板的多通道，性能也拉不开7700K的差距。发布在X299上有点蛋疼

royalk · 发表于 2017-7-12 14:58

chungexcy 发表于 2017-7-12 13:00
LinX_v0.6.8_(11.3.3.010).zip

mkl 2017大版本的上一个11.3 update 3。

这个文件好像已经删除了。。支持AVX2.0最好的版本就是0.6.8？

royalk · 发表于 2017-7-12 14:59

ydjj 发表于 2017-7-12 13:36
我感觉现在整个skylake-SP都要成为AVX512的踏路石
不实际上AVX512看看疗效根本没法优化，一直纸上谈兵总得 ...

正常的，处理器现在的进步就体现在不断优化补缺上了。

royalk · 发表于 2017-7-12 15:00

haomingci3 发表于 2017-7-12 13:08
R大试试看过不同的指令的P95X64看看有什么不同，p95 26.6.3应该是SSE最热（der8auer超5G应该过的是这个）， ...

按之前的情况，26.6到27.9 CPU功耗大概差50%，再到28.x大概差20%，到29.x，待会我测测

royalk · 发表于 2017-7-12 15:17

haomingci3 发表于 2017-7-12 13:08
R大试试看过不同的指令的P95X64看看有什么不同，p95 26.6.3应该是SSE最热（der8auer超5G应该过的是这个）， ...

图省事，全部small ftt，CPU 4G VINPUT=1.85v VCORE=1.082v VCCIO=1.05v VCCSA=0.95v VDDQ=1.445v

版本       12V输入电流
29.1       25.9
28.10    25.8
27.9       24.9
26.6       18.8

看来功耗大是来自AVX单元，而不是跑AVX多少版本。
PS:把IO/SA电压降下来，满载断电现象也大幅减轻，只要不跑memtest，0.95v够DDR4-4000了。

sun3797 · 发表于 2017-7-12 17:45

royalk 发表于 2017-7-12 14:58
这个文件好像已经删除了。。支持AVX2.0最好的版本就是0.6.8？

大大能给一个LinX v0.6.8的下载地址吗？
或者发到邮箱也可以sun3797@163.com

一张主板两个架构 Intel Core i9 7900X与Core i7 7740X评测

本帖子中包含更多资源

本帖子中包含更多资源