PCEVA,PC绝对领域,探寻真正的电脑知识
打印 上一主题 下一主题
开启左侧

论指令集和超线程的作用与重要性

[复制链接]
81#
chungexcy  楼主| 发表于 2015-11-10 23:42 发自PCEVA移动客户端 | 只看该作者
royalk 发表于 2015-11-10 19:11
明天我抽空跑一下,最近平台变动比较大,一直没空跑

麻烦了,等您方便时候跑跑吧。
x265那个就不麻烦您了,毕竟已经有别的成绩了。
82#
royalk 发表于 2015-11-11 12:15 | 只看该作者
蓝天翔燕 发表于 2015-11-10 23:29
很可惜日常应用很难用到,所以大家才有二代i5超超战几年的观念

所以还是看需求,有些人会用得到。就好像双核跟四核,4C4T和4C8T一样道理。
83#
蓝天翔燕 发表于 2015-11-13 16:53 | 只看该作者
royalk 发表于 2015-11-11 12:15
所以还是看需求,有些人会用得到。就好像双核跟四核,4C4T和4C8T一样道理。
...

还要看看目前的系统和软件环境,双核和四核的差距挺大,但是四核以上,一般应用感知不强烈,玩游戏作为主要应用的话,确实二代以上的高频率i5也能胜任。现在发展最快一个是SSD,一个是显卡了
84#
royalk 发表于 2015-11-13 17:57 | 只看该作者
chungexcy 发表于 2015-11-10 14:32
royalk您好,之前请您用6700k跑了一个waifu2x。最近那个作者更新了一个版本,在我的5200u上有了50%的提升 ...

不好意思主板来迟了,平台刚搭好,用一张57M的JPG跑了一下,比之前的版本提升蛮多的,得50%了。


960显卡的性能如下,基本没变化,block size依然是1024:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1绝对值 +1 收起 理由
chungexcy + 1 赞一个!

查看全部评分

85#
chungexcy  楼主| 发表于 2015-11-14 11:54 | 只看该作者
本帖最后由 chungexcy 于 2015-11-14 11:56 编辑
royalk 发表于 2015-11-13 17:57
不好意思主板来迟了,平台刚搭好,用一张57M的JPG跑了一下,比之前的版本提升蛮多的,得50%了。

太感谢啦你6700k的实际运行频率是多少?是4.0G还是超频了?

确实提升很大,我看了代码的改动,AVX/FMA的核心计算部分没变,这块应该已经几乎100%。这次应该是修正了计算部分以外浪费的时间。我越来越期待canonlake的消费级8核+AVX512了。

我测试了sandybridge,也是提升50%。在5200@2.5g上,分别有120/128的成绩。

而且这次修正大大提高了不带超线程的效率(比之前高了80%),sandybridge的avx非超线程反而更快(4-5%),而haswell的fma超线程提高10%,感觉已经是到理论极限,超线程也就没太大作用了。像之前优化不到位,超线程的作用还是挺大。

PS. 这个版本已经可以用来烤机测试散热了。我发现运行这个版本,功耗没增加,核心利用率提升,导致温度高了不少。核心温度/实际功耗比,比运行linx和prime95还大。虽然同频下绝对温度和功耗不是最高的,但在TDP限制睿频幅度的平台上(5200u)温度比这两位还高。。。

86#
royalk 发表于 2015-11-14 21:06 | 只看该作者
chungexcy 发表于 2015-11-14 11:54
太感谢啦你6700k的实际运行频率是多少?是4.0G还是超频了?

确实提升很大,我看了代码的改动,A ...

4.5G的,烧机还差点,对内存的压榨不如p95,我这边12V电流表录得功耗大概是132W,P95大概会到140W
87#
tx97 发表于 2017-1-1 15:30 | 只看该作者
早就看到这个帖子,奈何只有一个e3v2,就没有贴测试成绩。这几天单位的服务器到了,想起还有这么个程序,就跑了下测试。
机器配置:E5-2680V4 x 2,128G,测试结果忘了截图,大概是400多g和600多g。不能跑满线程,cpu占用维持在30%左右。
88#
PolyMorph 发表于 2017-1-2 13:54 | 只看该作者
x4 955 3.6ghz
process successfully done! (all:21.8061[sec], 58.3874[GFLOPS], filter:21.2473[sec], 59.923[GFLOPS])
process successfully done! (all:23.6589[sec], 53.815[GFLOPS], filter:23.0092[sec], 55.3344[GFLOPS])
测了20次,后台活动对成绩影响很大
89#
chungexcy  楼主| 发表于 2017-1-3 13:04 | 只看该作者
tx97 发表于 2017-1-1 15:30
早就看到这个帖子,奈何只有一个e3v2,就没有贴测试成绩。这几天单位的服务器到了,想起还有这么个程序,就 ...

最近我也来了一个双路的e5 2683 v3,算是你的低频版,也试了一下,大概差不多600+GFLOPS。当时没有考虑超过8线程的,所以有些参数没有调整清楚,利用率上不去。

我改了一个参数,重新拿大图试了一下,包括2楼的旧版和78楼的新版。

里面的数字是filter的值,也就是纯计算部分的性能,双路能到1.5t的样子。〔all里面还包含读图写图等操作,不予考虑〕


你可以试试78楼的新版本,原作者把性能大幅优化到理论极限的78%了。我提供的附件里,包含一个更大的新测试图片,和把参数改大以后的新run.bat。如果方便的话,直接覆盖78楼里面的文件,然后运行run.bat就好。[不要做bat_for_cpu.exe > run.bat这一步]

双路2680 v4应该能超过1.5t的。我对2680v4能运行在多高的频率还是挺感兴趣的。120w的2683 v3,大概只有2.3g的样子。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
90#
tx97 发表于 2017-1-4 16:40 | 只看该作者
可能要等一段时间才能测试了。前几天服务器送来电脑公司装了个win2008,我在那上面跑的测试。这两天按我们的要求换esxi,电脑公司派来一位高手,连esxi安装时提示f11继续esc取消的英文都不认识……折腾了3天才在厂家电话遥控下装好esxi,距离完工遥遥无期啊。
91#
tx97 发表于 2017-1-4 21:34 | 只看该作者
实在受不了,自己动手装了个win10跑了下测试,貌似还不如你。原因可能是因为我们的服务器内存是单通道的,还有128G还没有采购回来。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
92#
chungexcy  楼主| 发表于 2017-1-5 01:11 | 只看该作者
本帖最后由 chungexcy 于 2017-1-5 01:13 编辑
tx97 发表于 2017-1-4 21:34
实在受不了,自己动手装了个win10跑了下测试,貌似还不如你。原因可能是因为我们的服务器内存是单通道的, ...

应该不是单通道的原因吧,这程序优化的很好的。有空我拔掉测试一下。你的win10应该是实体机吧。
不过看你的截图,感觉是你频率被TDP限制的很严重,感觉严重降频了
93#
tx97 发表于 2017-1-5 10:22 | 只看该作者
有可能。之前win2008是物理机,win10是虚拟机。貌似ESXI不支持睿频,只能跑基频
94#
chungexcy  楼主| 发表于 2017-1-5 10:28 | 只看该作者
本帖最后由 chungexcy 于 2017-1-5 10:30 编辑
tx97 发表于 2017-1-5 10:22
有可能。之前win2008是物理机,win10是虚拟机。貌似ESXI不支持睿频,只能跑基频 ...

双核下,虚拟机大概会损失10%的性能。不过看任务管理器,你确实连基础频率跑到吧?
其实应该可以直接单独插一个系统盘上去的


95#
tx97 发表于 2017-1-5 10:53 | 只看该作者
waifu2x显示的是2.4G,貌似损失了0.4g
"高手"师傅又来了,改天试试PE能否启动,可以的话再试试
96#
tx97 发表于 2017-1-7 16:22 | 只看该作者
今天改了下虚拟机设置,设置为单路28线程,这结果比双路56线程还高,不明真相吃瓜群众

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部