PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

论指令集和超线程的作用与重要性

[复制链接]
1#
royalk 发表于 2015-9-17 16:38 | 显示全部楼层
所以不要说近几代CPU没什么提升,只是新的指令集在大部分应用里你用不到。
2#
royalk 发表于 2015-9-18 11:00 | 显示全部楼层
chungexcy 发表于 2015-9-18 02:49
你不是有个skylake的i7吗,要不来测试一下?

6700K,默认频率
功耗很够力,12V直接爆到9.3A了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
3#
royalk 发表于 2015-9-18 11:13 | 显示全部楼层
chungexcy 发表于 2015-9-18 11:07
提升幅度15%左右,看来提升比我想象的好些,之前认为10%。不过112w的功耗也是够高,果然E5为了能效,必须 ...

可能跟内存也有一定关系,DDR4-2133
回头我换到Z170上再跑一次吧
4#
royalk 发表于 2015-9-18 11:30 | 显示全部楼层
chungexcy 发表于 2015-9-18 11:16
这个基本和内存无关,我认为已经优化到极限了。源代码中我看到他把能用的所有avx寄存器全部用上了,内存不 ...

我找了张大点的图片来试,现在大概能到350GFLOPS左右
5#
royalk 发表于 2015-9-18 14:18 | 显示全部楼层
chungexcy 发表于 2015-9-18 14:13
最后的结果有两个速度:第一个是包含读取、保存、和主要filter计算时间一起的平均速度。看第二个filter更 ...

filter是332,比前面的322要高那么一点
6#
royalk 发表于 2015-9-18 14:38 | 显示全部楼层
chungexcy 发表于 2015-9-18 14:20
不是说跑出来了一个 350GFLOPS 吗?对应的filter是多少?

那是跑的过程当中有部分iteration显示的,很多350+,但是最后几个block好像都没有,原图解析度8476*5651

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
7#
royalk 发表于 2015-9-18 15:11 | 显示全部楼层
chungexcy 发表于 2015-9-18 14:54
对了,你有N卡独显吗?有的话可以试着去掉 --disable-gpu。看看显卡的性能。
如果可以测试,要监控一下GPU ...

GTX 960,block size=1024,占用显存只有1.3G,,不知道还能不能更大

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
8#
royalk 发表于 2015-9-18 15:26 | 显示全部楼层
chungexcy 发表于 2015-9-18 15:25
GPU的运行效率果然低好多,理论2.77[TFLOPS],有效结果才1.1[TFLOPS]。只能说这个程序对CPU的优化确实到 ...

占用率不是随时都到100%,优化应该还有很大空间。当年CUDA挖矿程序也是如此,就算占用率到100%了,功耗也能反映出资源是否被充分调用。
9#
royalk 发表于 2015-9-18 16:15 | 显示全部楼层
chungexcy 发表于 2015-9-18 16:08
方便用CPU再跑一次吗?这次加一个 -j 4,看看 skylake 的超线程提升多少。

...

filter 252GFLOPS
10#
royalk 发表于 2015-9-18 16:33 | 显示全部楼层
chungexcy 发表于 2015-9-18 16:27
真这结果?这也太高了吧。。。

确实就是加了-j 4而已
11#
royalk 发表于 2015-9-18 16:45 | 显示全部楼层
chungexcy 发表于 2015-9-18 16:37
这是单线程提升30%的节奏吗?你用我之前内置的那个图,测得的all性能是多少?
...

用你原来的图,4线程,all性能是223,filter是245
12#
royalk 发表于 2015-9-18 16:53 | 显示全部楼层
chungexcy 发表于 2015-9-18 16:51
看来确实是25-30%的单线程提升。。。我可以把你的数据加到我一开始的对比表格吗?

...

可以,加吧
4线程,all是223.434,filter是245.022
8线程前边截图里有了
13#
royalk 发表于 2015-11-10 19:11 | 显示全部楼层
chungexcy 发表于 2015-11-10 14:32
royalk您好,之前请您用6700k跑了一个waifu2x。最近那个作者更新了一个版本,在我的5200u上有了50%的提升 ...

明天我抽空跑一下,最近平台变动比较大,一直没空跑
14#
royalk 发表于 2015-11-11 12:15 | 显示全部楼层
蓝天翔燕 发表于 2015-11-10 23:29
很可惜日常应用很难用到,所以大家才有二代i5超超战几年的观念

所以还是看需求,有些人会用得到。就好像双核跟四核,4C4T和4C8T一样道理。
15#
royalk 发表于 2015-11-13 17:57 | 显示全部楼层
chungexcy 发表于 2015-11-10 14:32
royalk您好,之前请您用6700k跑了一个waifu2x。最近那个作者更新了一个版本,在我的5200u上有了50%的提升 ...

不好意思主板来迟了,平台刚搭好,用一张57M的JPG跑了一下,比之前的版本提升蛮多的,得50%了。


960显卡的性能如下,基本没变化,block size依然是1024:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1绝对值 +1 收起 理由
chungexcy + 1 赞一个!

查看全部评分

16#
royalk 发表于 2015-11-14 21:06 | 显示全部楼层
chungexcy 发表于 2015-11-14 11:54
太感谢啦你6700k的实际运行频率是多少?是4.0G还是超频了?

确实提升很大,我看了代码的改动,A ...

4.5G的,烧机还差点,对内存的压榨不如p95,我这边12V电流表录得功耗大概是132W,P95大概会到140W
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部