评测该怎么写?国外论坛看的一个值得讨论的话题

quietist · 发表于 2015-5-2 03:46

本帖最后由 quietist 于 2015-5-2 03:47 编辑

　　其实，说到底标准还是很简单，就是——以真正切实的“（用户）需求”，来决定评测／推荐标准。

　　就像俺野人在三年前混了一段ＰＣｅｖａ时发现的问题：——当时主流的各种跑分软件的测试项目和打分结果，都不能跟实际中的应用直接挂钩，也就是说：潜在购买者和使用者是无法依据这些跑分和评价来做出选择和购买判断的；只有ｐｃｍａｒｋ系列，它的测试项目都是主流常用的个人ＰＣ应用类型典型代表，那么它的测试标准显然更接近个人ＰＣ使用者的真实需求。

　　而在当时离开论坛不上ｐｃｅｖａ之前，其实俺已经再次意识到ｐｃｍａｒｋ标准测试的局限，无论７还是８，它都是一种“典型个人用户需求”的“综合”测试。

　　而实际使用和购买者当中，符合这类“综合”需求特征的虽然数量上有不少，但未必占主体或绝大多数，实际上更多的个人用户需求，往往并非“综合”型的，而是某类“特征”型的。

　　俺以下从个人容易想到的角度举几个具体例子，比如常见的典型个人需求应用类型有——

１、ＤＩＹ或性能发烧友型的，总的人数并不算很多，但在本论坛或某些隔壁论坛却不少，其“需求”关注重点是追求某些性能或指标参数的极致体验什么的，跑分对他们而言有时很有某种意义；

２、游戏玩家型的，需求关注重点是游戏性能；

３、实时联网操作型的，比如证券期货交易、比如个人电子商务网站等，需求重点在网络数据和本地数据的交互处理等；

４、个人（包括移动）图形工作站型的，需求重点在图形处理等方面（难度和负荷不会太高，如建模一渲染就几个小时起／一张图就几个Ｇ的，家用环境基本没法碰）；

５、影音玩家型的，需求重点在４Ｋ视频源播放或视频转制等方面；

６、家庭办公或移动办公型的，需求关注重点是办公（如ｏｆｆｉｃｅ套件等）应用相关性能、稳定性和可靠性兼顾；

７、家庭客厅应用型的，需求重点在多媒体、家庭内部共享方面；

８、上网等简单应用型的．．．

　　以上客户／使用者群体类型区分，归根到底的标准还是需求类别不同，那么评测也好推荐也罢，说到底都是为了影响或帮助某些特定需求类型的群体，所以从实用、客观、理性、厚道的角度来说呢，最好是先弄清和说明，单一针对和适用的是哪类人群、哪类典型需求，或者就需要根据不同典型需求的人群类别，进行区分。

　　举个例子，相对应的，对于ｄｉｙ发烧友来说，变砖不是什么大事，反而说不定有些人还借此来试试修砖回炉什么的；对高清爱好者来说，动辄几十Ｇ一部的视频显然不可能放在ＳＳＤ和系统盘上，变砖直接的影响也并不大，就算视频转制而言，由于每一部都可能耗时良久经常放在后台或专机慢拖，所以ｓｓｄ变砖也不是太过严重的事；但对图形工作站使用者，或个人联网交易用户来说，云存储或云计算很多时候不能完全覆盖甚至不可得适用的话，本地实时处理和暂存数据的损失都可能是很难承受的，盘变砖和系统崩溃带来的影响都可能是致命性的．．．

　　这些可能就是对应于不同需求指征类型的不同产品要素了吧，不仅可能涉及性能主要大项、存储容量或价格，还有安全性、可靠性、售后服务和响应、可替代时效性、方便性等相关的因素需要指标化，进行不同导向性评测中的具体选取。

　　说白了，如果这样做得出的评测，就不是网评的水准了，而是专业厂商或专业第三方调／研／测／控的良心水准了（实际上多数厂商和第三方的相关调研测控也做不到这种意义上的水准），其价值如何，可以说难以估量、难以想象。

quietist · 发表于 2015-5-3 23:34

mcszjs 发表于 2015-5-2 18:28
先扔2个链接：
http://bbs.pceva.com.cn/thread-94811-1-1.html
浴室的pcm8测试全系列目录帖子末有。

　　首先ｐｃｍ测试的实用意义，俺野人在所接触到的网络环境中就勉强算是最先强调者之一，不存在俺需要否定ｐｃｍ测试意义的可能，只不过是希望更进一步的思考和接近真实需求罢了。

　　其次，变砖的情况只是举个例子，毕竟这种例子，使用者的反应经常会比较大，所以具有典型性。其他例子同样多的是。如果变砖都用多重备份来解决，那么显然这还不是很多注重实时工作的用户典型关注，Ｒ１或实时后备系统也许更好　——但这对咱们谈论硬盘选择又有多大意义？等于是转移到另一个问题乐。

　　十几年前俺曾经接触过一家操作评测提供商，当时他们评测的机制设计是封闭的，作为商业秘密在核心资深技术员工以外均不公开不具体解释，不过经过短暂多角度侧面交流，数天后俺问他们，是否关键的做法就是模拟实际应用的操作动作，从他们当时的惊讶反应看应该是一发命中鸟。

　　那个案例直到如今还具有很强的参考意义，也就是说评测的意义在哪里？在于对需求满足的实用化。

　　ｐｃｍ从７到８怎么变化，无非是回放应用的种类选择、版本更替、权重调整，某种角度上来说，虽然远胜跑分评测程序的理论化（每个跑分评测程序所对应的典型或极端状况或许都符合某个或某些专门或专业应用，但遗憾的是，非最博通的相关专业牛人很难具体知道如何对应），但仍然离评测具体需求者，有一定距离。

　　在俺野人看来，理想的实用评测程序，如果条件允许、实际可行，最好能从ｐｃｍ目前的模式再前行一大步，允许客户自由定制、组合以及调整权重，确认自己的典型或重负荷甚至极限需求。

　　不要说什么特殊应用的用户就该自己懂这些，真实世界里远非如此．．．

　　当然，俺不太清楚浴室这个问题究竟什么出发点，只是看了外坛某种观点的感受、还是真的想要对这个问题本身究至穷极？

　　如果只是随便聊聊，那也可以当俺只是路过偶尔感慨下而已。

评测该怎么写?国外论坛看的一个值得讨论的话题

浏览过的版块