本帖最后由 jasu30 于 2011-11-10 16:19 编辑
为了让大家更容易掌握手头显卡的硬件参数,这里通过常用的GPU-Z来逐项介绍。GPU-Z最新版下载:http://bbs.pceva.com.cn/thread-16983-1-1.html
首先对GPU-Z这款软件的界面进行一个大致分区的解读,从上至下共7个分区,其中每个分区的具体含义是:
●名称/Name:此处显示的是显卡的名称,也就是显卡型号。但是注意这里并不是显卡具体型号,例如同样写着“NVIDIA GeForece GTX 460”,但实际上显卡产品有三种:460 1G、460 768M、460 SE。同样,“Radeon HD 6800 Series”包含6870和6850两款产品。
【图形核心】图形核心(GPU)又称图形芯片,是显卡的心脏。它对显卡的3D特效、渲染效率、视频功能甚至物理计算等方面起着决定性的作用。因此图形核心在很大程度上决定了显卡的档次。目前有能力设计图形芯片的有AMD、NVIDIA、Intel、S3、SIS等几家厂商,其中AMD和NVIDIA占据了绝大部分独立式显卡图形核心市场份额,其他几家则主要面向整合式图形核心市场。
●核心代号/GPU:此处显示GPU芯片的代号,如上图所示的:GF114等。
【核心代号/研发代号】绝大多数处于研发阶段的图形核心都具有研发代号,例如GeForece GTX 580在研发阶段的代号为GF110,Radeon HD 6970研发阶段的代号为Cayman XT。需要强调的是,研发代号相同的图形核心属于相同的设计和架构,但厂商往往将同一研发代号的图形核心细分为面向各层用户的多种型号,例如核心代号同为GF104的显卡就分为GTX 460 1G、GTX 460 768M、GTX 460 SE三种型号,它们的流处理器数量、ROPs数量、核心频率、显存位宽等等存在很大差异,因此我们不能以研发代号代替显卡型号。
●修订版本/Revision:此处显示GPU芯片的步进制程编号。
【修订版本/核心步进】类似CPU的核心步进,GPU在改进制程工艺后,也会跟进核心步进。比如经典的G92核心在65nm制程时代是A2步进,到了55nm就成了B1步进。新步进意味着更低的发热量和更强的超频性能。
●制造工艺/Technology:此处显示GPU芯片的制程工艺,如55nm、40nm等。
【制造工艺】常被DIY玩家津津乐道的图形核心制造工艺实际就是芯片的制程,它指的是晶体管的线条宽度,目前主要以nm(纳米)为单位。在核心尺寸不变的情况下,晶体管的线条宽度越小,可容纳的晶体管数量越多,从而提高性能;在晶体管数量不变的情况下,晶体管的线条宽度越小,核心尺寸越小,成本和功耗越低。可见芯片的制造工艺对提升性能、控制成本和功耗都极其重要。今年图形核心的制造工艺还是40nm为主流,年底将提升至28nm。
●核心面积/Die Size: 此处显示GPU芯片的核心尺寸。
【核心面积】Die又称为内核,是GPU最重要的组成部分。GPU中心那块隆起的芯片就是核心,是由单晶硅以一定的生产工艺制造出来的,GPU所有的图形运算、通用运算等等都由核心执行。核心面积指的就是内核的面积大小,一般用游标卡尺实测的核心面积要比官方宣布的略大一些。需要注意的是,NVIDIA的高端GPU由于核心面积较大,都有IHS(Integrated Heat Spreader,集成散热片,一般为铜材料)保护着,防止散热器压坏核心,与目前桌面电脑的CPU情况类似;而AMD实行小核心战略,其核心只有外围一圈和Die厚度相同的金属框保护。
(左图为NVIDIA G80核心拆开IHS后露出Die,右图为实测GPU核心大小)
相关贴:图文展示核心大小——【GPU核心Die面积】速查
●BIOS版本/BIOS Version:此处显示显卡BIOS的版本号。
【显卡BIOS】BIOS是Basic Input Output System的简称,也就是“基本输入输出系统”。显卡BIOS固化在显示卡所带的一个专用存储器里。显卡上的BIOS是没有任何人机交互接口的,所以叫固件比较合适。通常同核心的不同厂家的显卡,核心显存频率也不同,就是通过固件定制的。通过刷固件,我们能超频,甚至能开核(打开被屏蔽的流处理器等),成为某些显卡或是个别厂商的卖点。但是:刷显卡BIOS有风险,刷前请慎重。
●设备ID/Device ID:此处显示设备的ID码。
【设备ID】图形核心型号相同,此ID就相同,不管是什么牌子的显卡,例如460 1G和460 768M都是10DE-0E22。核心型号不同则设备ID不同,例如HD 6870(Barts XT)是1002-6738,HD 6850(Barts Pro)是1002-6739,HD 6790(Barts LE)是1002-673E。
●制造厂商/Subvendor:此处显示该显卡OEM制造厂商的名称。
【制造厂商】公版PCB方案显卡一般显示“NVIDIA”或者“AMD”,非公版方案显示你所购买的品牌,或者显示“Undefined”(未定义)。
●光栅操作单元/ROPs:此处显示GPU拥有的ROP光栅操作处理单元的数量。
【光栅操作单元】Raster Operations Units,即光栅操作单元(又译:光栅化处理单元),表示显示GPU拥有的ROP光栅操作处理单元的数量。通常来说:3D图形处理可以分成四个主要步骤,几何处理、设置、纹理和光栅处理,而ROPs就是处理光栅单元。ROPs主要负责游戏中的光线和反射运算,兼顾AA、高分辨率、烟雾、火焰等效果。游戏里的AA(抗锯齿)和光影效果越厉害,对ROPs(光栅化处理单元)的性能要求也就越高,否则就可能导致游戏帧数急剧下降。比如GTX 465和HD 5830性能很不让人满意,除了削减了较多的流处理之外,就是ROPs数量大大减少,限制了其性能发挥。需要注意的是,AMD显卡和NVIDIA显卡,其ROPs单元和流处理器单元没有关联(“N卡的ROPs单元和流处理器是“捆绑”的,即置于SIMD之内,所以倘若消减N卡的流处理数量,其ROPs单元也随之消减”——这一说法并不正确)。
●总线接口/Bus Interface:此处显示显卡和主板北桥芯片之间的总线接口类型以及接口速度。
【PCI Express】PCI Express简称PCI-E,属于第三代I/O总线,基于点对点串行技术,是目前主流的显卡接口界面。PCI-E包括x1、x4、x8、x16几种规格,其中供显卡使用的是PCI-E x16,接口带宽可达8GB/s,远远超过只有2.1GB/s带宽的AGP 8x,它不仅解决了显卡和主板之间带宽不足的问题还增强了对显卡的供电能力。
【AGP】AGP是Accelerated Graphics Port(加速图形端口)的缩写,是前几年显卡接口。AGP接口历经了AGP 1.0(1x/2x)、AGP 2.0(4x)、AGP 3.0(8x)几个发展阶段,带宽从最早的AGP 1x(66MHz),266MB/S的带宽发展到了最高规格的AGP 8x(533MHz),2.13GB/S的带宽。但是AGP 8x接口也成为显卡发展的瓶颈,因此在2006年被PCI-E接口完全取代。
●着色单元/Shaders:此处显示GPU拥有的着色器的数量。
【流处理器】先来介绍下“统一架构”的流处理器的由来。传统管线架构:以往显卡由顶点渲染管线和像素渲染管线组成,生成图像的过程都是先由顶点渲染管线中的Vertex Shader(顶点着色器)生成基础的几何图形骨架(由三角形构成),然后再由像素渲染管线中的Pixel Shader(像素着色器)进行填色,最后才是像素渲染管线中的纹理单元进行贴图。而当新的统一渲染架构提出之后,顶点着色器和像素着色器被合二为一,成为流处理器(Shaders),它将同时负责顶点着色和像素着色,避免了负载不均衡的情况发生。最先提出统一渲染架构的是微软的DirectX 10。需要说明的是,N卡和A卡的所采取的核心架构是不一样的,N卡采用的是MIMD架构。多指令流多数据流(Multiple InstructionStream Multiple DataStream,简称MIMD),它使用多个控制器来异步地控制多个处理器,从而实现空间上的并行性,所以N卡是一个发射器;A卡采用的是SIMD架构设计,即Single Instruction Multiple Data(单指令流多数据流),A卡是将4个简单指令+1个复杂指令打包,再用一个发射器发出。所以A/N两者不能进行流处理器数量的简单对比。
●DirectX版本/DirectX Support:此处显示GPU所支持的DirectX版本。
【DirectX】DirectX并不是一个单纯的3D API,它是由微软公司开发的用途广泛的API,包含Direct Graphics(Direct 3D+Direct Draw)、Direct Input、Direct Play、Direct Sound、Direct Show、Direct Setup、Direct Media Objects等多个组件,它提供了一整套的多媒体接口方案,只是DirectX在3D图形方面的表现最具影响力,目前主流的是DirectX 11,引入了Shader Model 5.0的全面支持,可以实现精美、逼真和复杂的3D画面。
(关于DirectX演化和新技术介绍,我会开新帖介绍,请保持关注哦。)
【Shader Model】Shader Model(在3D图形领域常被简称SM)就是“优化渲染引擎模式”。事实上,Shader(渲染或称着色)是一段能够针对3D对象进行操作、并被GPU所执行的程序。通过这些程序,程序员就能够获得绝大部分想要的3D图形效果。在一个3D场景中,一般包含多个Shader。这些Shader中有的负责对3D对象表面进行处理,有的负责对3D对象的纹理进行处理。早在微软发布DirectX 8时,Shader Model的概念就出现在其中了,并根据操作对象的不同被分为对顶点进行各种操作的Vertex Shader(顶点渲染引擎)和对像素进行各种操作的Pixel Shader(像素渲染引擎)。Shader Model 已经有五个版本了:分别是Shader Model 1.0(DirectX8.0)、Shader Model 2.0(DirectX9.0b)、Shader Model 3.0(DirectX9.0c)、Shader Model 4.0(DirectX10)、Shader Model 4.1(DirectX10.1)和Shader Model 5.0(DirectX11)。
●像素填充率/Pixel Fillrate:此处显示GPU的像素填充率。
【像素填充率】像素填充率是指图形处理单元在每秒内所渲染的像素数量,是决定一块3D显卡在各种分辨率下的性能表现的一个重要参数,它的值越大,显卡核心性能就越好,单位是GPixel/S(每秒十亿纹理)
核心像素填充率=核心频率×光栅单元数目/1000
●纹理填充率/Texture Fillrate:此处显示GPU的纹理填充率。
【纹理填充速率】是指在多边形每个面上填充的颜色的纹理,单位是GPixel/S(每秒十亿像素)
纹理填充率=核心频率×纹理单元数目/1000
这两个参数的值在GPU-Z中自然是越大则越能表明显卡所能处理的能力越强悍。并且核心频率是像素填充率(Pixel Fillrate)和纹理填充率(Texture Fillrate)的计算因数,显然显卡核心频率越高,这两个值越大。而其中的光栅单元数目即ROPs的值,ROPs的值越大,像素填充率也就越大。
●显存类型/Memory Type:此处显示显卡所采用的显存类型,如:GDDR3、GDDR5等。
【GDDR】即Graphics DDR SDRAM,是用于显卡领域的DDR SDRAM。DDR SDRAM是Double Data Rate SDRAM的缩写,意为双倍速率同步动态随机存储器,在一个时钟周期内传输两次数据,性能比老式SDRAM强很多。
【GDDR2】相对GDDR,GDDR2显存加入了多路复用技术,在不改变外部数据带宽和显存颗粒工作频率的情况下,数据传输带宽比GDDR显存提升一倍。但存在发热量较高的问题。
【GDDR3】在GDDR2的基础上,GDDR3显存发热量得到了控制,并且工作频率更高。GDDR3显存的工作频率可以轻松突破1GHz,从而使显存的带宽更高。GDDR3显存的功耗仅为普通GDDR的一半,发热量更低。由于高性能的GDDR5显存普及,GDDR3已经成为目前较低端显卡使用的显存。
【GDDR4】GDDR4属于双倍数据率内存,通过使用Cutting-edge技术的Data Bus Inversion及Multi-Preamble技术,使其在理论上相对GDDR3的运行效率提升了56%,使用GDDR4显存能达到更高的工作频率和更强的实际性能。但是DDR4的延迟是要大于DDR3的,无论DDR3,DDR4,只要频率高的性能就高。所谓延迟是高频率DDR必定有的东西。同频率显卡自然是延迟低的好,不同频率的就是高频的好。GDDR4只是过渡产品,GDDR5时代已经到来。
【GDDR5】与GDDR4相比,GDDR5的最大亮点就是带宽更高了,从16GB/s升至20GB/s,同时虽然电压还是保持在1.5V,但功耗会更低,因为GDDR5会自动降低空闲显存的频率,并支持错误纠正、适应性界面计时等多种新技术。按照奇梦达的说法,GDDR5的性能可达GDDR3的三倍。目前主流显卡都已经使用了高速的GDDR5显存。
●显存位宽/Bus Width:此处显示GPU与显存之间连接的带宽。
【显存位宽】Bus Width(位宽)往往是玩家最容易忽视的一个概念。显存位宽是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大。可以说显存位宽对显卡性能的影响相比显存容量而言要大不少。显卡显存位宽的权重到底有多大,举个例子:HD 6850 > HD 6790 > GTX 550 Ti > HD 5770。我们重点关注下HD6790和GTX550Ti这两款显卡,虽然说GTX 550 Ti在核心频率和ROPs数量上均高于HD 6790,但是在大部分的测试项目中为何又败下阵来了?首先HD 6790采用的HD 6850的缩减核心架构这一点自然不用说,其二就在显存位宽上,550 Ti仅为192Bit位的显存位宽,所以显存带宽的处理能力仅为98.4GB/S,而HD 6790则采用的是256Bit的显存位宽,显存带宽处理能力达到了134.4GB/S,相比550 Ti提升36.58%。而为什么550Ti相比HD 5770来说,又能够将HD 5770全面压制了,其实道理也是一样的。从显存带宽(Bandwidth)=(显存位宽 ×显存工作频率)/ 8 这个公式我们也可以看到当都采用GDDR5显存颗粒的时候,显存位宽就成为了影响性能的关键瓶颈。
另外需要说明一点,目前中端显卡显存位宽基本都是128-bits,如HD 6770,由于采用了GDDR5显存,其显存带宽值达到了76.8GB/s;而使用GDDR3,但显存位宽256-bits的9800GTX+才70.4GB/s,带宽值还不如前者(后面还会详细解释)。所以相同显存类型下才可以对比位宽的,否则没有意义。
●显存容量/Memory Size:此处显示显卡板载的物理显存容量。
【显存】显存也称帧缓存,在CPU和图形核心的数据交换过程中充当缓冲角色,同时显存还可作为图形芯片3D运算的数据缓存。图形核心的运作速度越快,对显存速度的要求便越高,这便是高端显卡往往配合大容量、高速度的高级显存的原因。
【显存容量】显存容量的大小决定着显存临时存储数据的能力,在一定程度上也会影响显卡的性能。显存容量也是随着显卡的发展而逐步增大的,并且有越来越增大的趋势。显存容量从早期的512KB、1MB等极小容量,发展到128MB、256MB,一直到目前主流的512MB、1024MB,高端显卡甚至已经具有1.5GB以上的显存了。值得注意的是,现在游戏在开了高分辨和高抗锯齿、高各向异性过滤后,会占用很大的显存容量,举个例子,1920x1080的分辨率下,一般要求显存容量为1G,才不会由于显存过小导致GPU性能难以发挥。另外就是有些低端入门级显卡,或者是一些移动平台的显卡,搭配了大容量显存,实际上是没有意义的。容量大小与GPU性能挂钩才能不浪费显存。
我们需要提醒玩家注意的是显存容量这个最经典的“骗局”,就是利用A卡的Hyper Memory(HM)或N卡的Turbo Cache(TC)的动态共享系统内存技术来谎称显卡的显存容量,想必这样的招数在进过前些年的“洗礼”之后,现在的不少消费者也逐渐对这样的雕虫小技都能够很快的精准识别。
●显存带宽/Bandwidth:此处显示GPU-Z与显存之间的数据传输速度。
【显存带宽】是指芯片和显存之间的数据传输速率,以GB/s为单位。显存带宽是决定显卡性能和数据最重要的因素之一。随着图形芯片的发展,需要的显存带宽也越来越大。
显存带宽(Bandwidth)=(显存位宽 ×显存工作频率)/ 8
GDDR5相对于GDDR3的核心优势在于显存带宽大幅度提升。从上面的计算公司我们可以清楚的看到,由于GDDR5显存颗粒具备两条数据总线,所以虽然采用的是和GDDR3同样的8位预取机制,但显存的工作频率可以到达GDDR3的两倍。最为典型的一个例子就是:采用GDDR5显存的GT240显卡要比采用GDDR3显存的GT240显卡性能领先16%左右,所以凭借强大的带宽优势,GDDR5在同位宽的情况下可以全面超越GDDR3。
●驱动程序版本/Driver Version:此处为系统内当前使用的显卡驱动的版本号/斜杠后面显示你的操作系统。
【驱动程序】Device Driver,是一种特殊的程序,其最重要的作用是将硬件本身的功能告诉操作系统,其次是完成硬件设备电子信号与操作系统及软件的高级编程语言之间的相互翻译。简单地说,驱动程序提供了硬件到操作系统的接口,并且负责协调二者之间的关系。正因为驱动程序有如此重要的作用,所以它被称为“硬件的灵魂”。NVIDIA和AMD分别为各自的显卡提供了“ForceWare”和“Catalyst(催化剂)”驱动程序,并且对其定期进行更新,对显卡做针对性的优化,用于解决存在的问题和进一步提高性能。所以我们推荐大家选择最新版的WHQL版驱动,最新版本的可以到本楼最上方链接的帖子中下载。
|