PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

y-cruncher -0.7.3 发布,对支持 AVX512 的一些重要说明

[复制链接]
41#
gtx9 发表于 2017-7-9 18:22 | 只看该作者
royalk 发表于 2017-7-9 18:17
刚才对比了一下6950x平台,50million 单线程
6950x 4G/3.1ring/3200 15.072s
7900x 4G/2.4mesh/3200 10.1 ...

跑多线程看看差距有没有拉大
42#
royalk 发表于 2017-7-9 18:31 | 只看该作者
gtx9 发表于 2017-7-9 18:22
跑多线程看看差距有没有拉大

20线程,差距缩小
6950x 1.803s

7900x 1.577s


感觉windows对7900x的线程调度还有些问题,不过对这个程序似乎影响不大,跑了多次误差在30ms以下。

43#
gtx9 发表于 2017-7-9 20:44 | 只看该作者
royalk 发表于 2017-7-9 18:31
20线程,差距缩小
6950x 1.803s

这差距缩小得有点大啊。。会不会是50million计算规模不够大?


44#
royalk 发表于 2017-7-9 21:04 | 只看该作者
gtx9 发表于 2017-7-9 20:44
这差距缩小得有点大啊。。会不会是50million计算规模不够大?

有可能,毕竟一秒多就结束了,可能并非所有浮点单元都参与了整个运算过程,而且内存缓存访问延迟占了很大比重。
来自安卓客户端来自安卓客户端
45#
里奥 发表于 2017-7-9 21:22 | 只看该作者
果然,要啥主频啊,内存才是王道
46#
OstCollector 发表于 2017-7-10 00:41 | 只看该作者
4年前的老物

https://indico.cern.ch/event/327 ... aswellConundrum.pdf

不知道他们有没有什么新的东西
47#
chungexcy  楼主| 发表于 2017-7-10 09:26 | 只看该作者
royalk 发表于 2017-7-9 18:17
刚才对比了一下6950x平台,50million 单线程
6950x 4G/3.1ring/3200 15.072s
7900x 4G/2.4mesh/3200 10.1 ...

其实提升还是比较有限的。skylake的AVX2的整数运算单元是改进过的,比broadwell快了进15%。
不过现在看来,Skylake X由于内存瓶颈,估计比15%稍微低一点吧?AVX512对比avx2的提升,其实就是作者吐槽的27%上下。

http://www.numberworld.org/y-cruncher/versions.html
v0.7.2.9469版本就可以让skylake-x运行AVX2版本。

多线程下,内存瓶颈都能影响avx2了。。。我感觉cinebench r15是不是也是类似的情况。。。

6950x的内存频率,是不是对多线程的影响不大?

48#
chungexcy  楼主| 发表于 2017-7-10 09:36 | 只看该作者
gtx9 发表于 2017-7-9 20:44
这差距缩小得有点大啊。。会不会是50million计算规模不够大?

你看我一楼贴的那张表,多线程下,明显是内存瓶颈了,连Skylake X跑AVX2都影响很大。。。

49#
ydjj 发表于 2017-7-10 10:06 | 只看该作者
chungexcy 发表于 2017-7-10 09:36
你看我一楼贴的那张表,多线程下,明显是内存瓶颈了,连Skylake X跑AVX2都影响很大。。。

...

那张图的内存频率太低了,才2133和3200
I9能四通道超到4000以上,不知道还有没有瓶颈
50#
chungexcy  楼主| 发表于 2017-7-10 10:12 | 只看该作者
ydjj 发表于 2017-7-10 10:06
那张图的内存频率太低了,才2133和3200
I9能四通道超到4000以上,不知道还有没有瓶颈
...

如果2133甚至3200对avx2都有瓶颈,那4000以上也不可能够avx512的双倍吞吐量需求。。。
51#
ydjj 发表于 2017-7-10 10:21 | 只看该作者
chungexcy 发表于 2017-7-10 10:12
如果2133甚至3200对avx2都有瓶颈,那4000以上也不可能够avx512的双倍吞吐量需求。。。
...

说了那么多年的内存墙终于到历史前台上了…高频内存价格怕不是要继续涨疯
52#
royalk 发表于 2017-7-10 11:38 | 只看该作者
chungexcy 发表于 2017-7-10 09:26
其实提升还是比较有限的。skylake的AVX2的整数运算单元是改进过的,比broadwell快了进15%。
不过现在看来 ...

现在我跑整数类型的测试同频效能基本一样,完全没有发挥出整数单元的优势,扩大的L2好像也没发挥作用…
来自安卓客户端来自安卓客户端
53#
royalk 发表于 2017-7-10 11:42 | 只看该作者
ydjj 发表于 2017-7-10 10:06
那张图的内存频率太低了,才2133和3200
I9能四通道超到4000以上,不知道还有没有瓶颈
...

4000内存一样是瓶颈,你可以看我前面的测试。
来自安卓客户端来自安卓客户端
54#
chungexcy  楼主| 发表于 2017-7-10 13:46 | 只看该作者
royalk 发表于 2017-7-10 11:38
现在我跑整数类型的测试同频效能基本一样,完全没有发挥出整数单元的优势,扩大的L2好像也没发挥作用…
...

15%应该只是单指avx2的整数部分,avx2版的y-cruncher,以及x265,应该同频还是有提升的,除非又被内存限制了。。。别的整数以及浮点运算,应该也就和之前broadwell到skylake时的,3-4%吧,而且内存别来搞事。。。

ring大概这锅绝对摔不掉。。。即使ring的带宽不能随核心增加而增加,也比超到100GB/s读取的内存快多了,带22核跑avx2问题都不大。。。L2怎么说呢,要是由于改成mest导致L3几乎没用了,那之前每核心2-2.5MB,就直接降到1MB了。。。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
55#
jerrytsao 发表于 2017-7-10 16:40 | 只看该作者
royalk 发表于 2017-7-9 16:14
更正一下之前我回帖中的一些错误,我本以为默认状态下GFLOPS低是因为TDP限制,看来其实并不是。
从下面的数 ...

MESH频率有多大影响, 我看AIDA跑分提升还是像Ring频率一样比较可观, 主存带宽影响如此之大和L3阉割是不是有直接的关系

56#
royalk 发表于 2017-7-10 16:52 | 只看该作者
jerrytsao 发表于 2017-7-10 16:40
MESH频率有多大影响, 我看AIDA跑分提升还是像Ring频率一样比较可观, 主存带宽影响如此之大和L3阉割是不是 ...

mesh比ring对内存性能的影响小一些。但我最新发现MESH基本不吃电压,默电超到3G比较容易。只是最后那0.2G的频率要很多电压去推,很不划算。
和L3变排除式应该是有关系,就像Ryzen超了内存性能可见比较明显的提升是一样道理的。

目前跑的一些数据,将就看。MESH电压的同步提升只是为了测功耗变化,并非稳定对应频率的最低电压。CPU 4.6G RAM 3600 16-16-16-36

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
57#
jerrytsao 发表于 2017-7-10 17:11 | 只看该作者
本帖最后由 jerrytsao 于 2017-7-10 17:12 编辑
royalk 发表于 2017-7-10 16:52
mesh比ring对内存性能的影响小一些。但我最新发现MESH基本不吃电压,默电超到3G比较容易。只是最后那0.2G ...

综合Coolaler那边评测的看, 这代内存频率到处起着决定性的作用啊, 上4000是必须的了, i9和Ryzen变得好像...

58#
royalk 发表于 2017-7-10 17:40 | 只看该作者
jerrytsao 发表于 2017-7-10 17:11
综合Coolaler那边评测的看, 这代内存频率到处起着决定性的作用啊, 上4000是必须的了, i9和Ryzen变得好像.. ...

是的,以前有L3罩着,现在没有了,L2就直接从内存拿数据了。

另外,他们那边的phantom throttling似乎更严重啊,1.25v 4.8G Cinebench居然才2480。。我的4.6G都2544了。
59#
ydjj 发表于 2017-7-10 18:11 | 只看该作者
royalk 发表于 2017-7-10 17:40
是的,以前有L3罩着,现在没有了,L2就直接从内存拿数据了。

另外,他们那边的phantom throttling似乎更 ...


这么改法L3还有啥用
L2增大了也没见有什么性能增益
60#
lacsiess 发表于 2017-7-10 19:12 | 只看该作者
ydjj 发表于 2017-7-10 18:11
这么改法L3还有啥用
L2增大了也没见有什么性能增益

农企和牙膏厂不约而同选择了弱化L3强化L2,可能有什么必须这么搞的理由吧......
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部