初学者看过来——常用【名词解释】汇总——教你认识显卡

jasu30 · 发表于 2011-5-5 01:40

本帖最后由 jasu30 于 2011-5-13 20:01 编辑

本文目录：

2L、通过GPU-Z认识你的显卡（上）

3L、通过GPU-Z认识你的显卡（下）

查找方法：
按“Ctrl”+“F”，输入关键词进行快速查找。

注：整理这些东西很花时间的，剩下内容慢慢补充完成，谢谢支持。

jasu30 · 发表于 2011-5-5 01:40

本帖最后由 jasu30 于 2011-11-10 16:19 编辑

为了让大家更容易掌握手头显卡的硬件参数，这里通过常用的GPU-Z来逐项介绍。GPU-Z最新版下载：http://bbs.pceva.com.cn/thread-16983-1-1.html

首先对GPU-Z这款软件的界面进行一个大致分区的解读，从上至下共7个分区，其中每个分区的具体含义是：

①.显卡名称、芯片型号部分：

●名称/Name：此处显示的是显卡的名称，也就是显卡型号。但是注意这里并不是显卡具体型号，例如同样写着“NVIDIA GeForece GTX 460”，但实际上显卡产品有三种：460 1G、460 768M、460 SE。同样，“Radeon HD 6800 Series”包含6870和6850两款产品。
【图形核心】图形核心（GPU）又称图形芯片，是显卡的心脏。它对显卡的3D特效、渲染效率、视频功能甚至物理计算等方面起着决定性的作用。因此图形核心在很大程度上决定了显卡的档次。目前有能力设计图形芯片的有AMD、NVIDIA、Intel、S3、SIS等几家厂商，其中AMD和NVIDIA占据了绝大部分独立式显卡图形核心市场份额，其他几家则主要面向整合式图形核心市场。

●核心代号/GPU：此处显示GPU芯片的代号，如上图所示的：GF114等。
【核心代号/研发代号】绝大多数处于研发阶段的图形核心都具有研发代号，例如GeForece GTX 580在研发阶段的代号为GF110，Radeon HD 6970研发阶段的代号为Cayman XT。需要强调的是，研发代号相同的图形核心属于相同的设计和架构，但厂商往往将同一研发代号的图形核心细分为面向各层用户的多种型号，例如核心代号同为GF104的显卡就分为GTX 460 1G、GTX 460 768M、GTX 460 SE三种型号，它们的流处理器数量、ROPs数量、核心频率、显存位宽等等存在很大差异，因此我们不能以研发代号代替显卡型号。

●修订版本/Revision：此处显示GPU芯片的步进制程编号。
【修订版本/核心步进】类似CPU的核心步进，GPU在改进制程工艺后，也会跟进核心步进。比如经典的G92核心在65nm制程时代是A2步进，到了55nm就成了B1步进。新步进意味着更低的发热量和更强的超频性能。

●制造工艺/Technology：此处显示GPU芯片的制程工艺，如55nm、40nm等。
【制造工艺】常被DIY玩家津津乐道的图形核心制造工艺实际就是芯片的制程，它指的是晶体管的线条宽度，目前主要以nm（纳米）为单位。在核心尺寸不变的情况下，晶体管的线条宽度越小，可容纳的晶体管数量越多，从而提高性能；在晶体管数量不变的情况下，晶体管的线条宽度越小，核心尺寸越小，成本和功耗越低。可见芯片的制造工艺对提升性能、控制成本和功耗都极其重要。今年图形核心的制造工艺还是40nm为主流，年底将提升至28nm。

●核心面积/Die Size： 此处显示GPU芯片的核心尺寸。
【核心面积】Die又称为内核，是GPU最重要的组成部分。GPU中心那块隆起的芯片就是核心，是由单晶硅以一定的生产工艺制造出来的，GPU所有的图形运算、通用运算等等都由核心执行。核心面积指的就是内核的面积大小，一般用游标卡尺实测的核心面积要比官方宣布的略大一些。需要注意的是，NVIDIA的高端GPU由于核心面积较大，都有IHS（Integrated Heat Spreader，集成散热片，一般为铜材料）保护着，防止散热器压坏核心，与目前桌面电脑的CPU情况类似；而AMD实行小核心战略，其核心只有外围一圈和Die厚度相同的金属框保护。

（左图为NVIDIA G80核心拆开IHS后露出Die，右图为实测GPU核心大小）

相关贴：图文展示核心大小——【GPU核心Die面积】速查

②.显卡的硬件信息部分：

●BIOS版本/BIOS Version：此处显示显卡BIOS的版本号。
【显卡BIOS】BIOS是Basic Input Output System的简称，也就是“基本输入输出系统”。显卡BIOS固化在显示卡所带的一个专用存储器里。显卡上的BIOS是没有任何人机交互接口的，所以叫固件比较合适。通常同核心的不同厂家的显卡，核心显存频率也不同，就是通过固件定制的。通过刷固件，我们能超频，甚至能开核（打开被屏蔽的流处理器等），成为某些显卡或是个别厂商的卖点。但是：刷显卡BIOS有风险，刷前请慎重。

●设备ID/Device ID：此处显示设备的ID码。
【设备ID】图形核心型号相同，此ID就相同，不管是什么牌子的显卡，例如460 1G和460 768M都是10DE-0E22。核心型号不同则设备ID不同，例如HD 6870（Barts XT）是1002-6738,HD 6850（Barts Pro）是1002-6739，HD 6790（Barts LE）是1002-673E。

●制造厂商/Subvendor：此处显示该显卡OEM制造厂商的名称。
【制造厂商】公版PCB方案显卡一般显示“NVIDIA”或者“AMD”，非公版方案显示你所购买的品牌，或者显示“Undefined”（未定义）。

③.显示芯片参数部分：

●光栅操作单元/ROPs：此处显示GPU拥有的ROP光栅操作处理单元的数量。
【光栅操作单元】Raster Operations Units，即光栅操作单元（又译：光栅化处理单元），表示显示GPU拥有的ROP光栅操作处理单元的数量。通常来说：3D图形处理可以分成四个主要步骤，几何处理、设置、纹理和光栅处理，而ROPs就是处理光栅单元。ROPs主要负责游戏中的光线和反射运算,兼顾AA、高分辨率、烟雾、火焰等效果。游戏里的AA(抗锯齿)和光影效果越厉害,对ROPs(光栅化处理单元)的性能要求也就越高,否则就可能导致游戏帧数急剧下降。比如GTX 465和HD 5830性能很不让人满意，除了削减了较多的流处理之外，就是ROPs数量大大减少，限制了其性能发挥。需要注意的是，AMD显卡和NVIDIA显卡，其ROPs单元和流处理器单元没有关联（“N卡的ROPs单元和流处理器是“捆绑”的，即置于SIMD之内，所以倘若消减N卡的流处理数量，其ROPs单元也随之消减”——这一说法并不正确）。

●总线接口/Bus Interface：此处显示显卡和主板北桥芯片之间的总线接口类型以及接口速度。
【PCI Express】PCI Express简称PCI-E，属于第三代I/O总线，基于点对点串行技术，是目前主流的显卡接口界面。PCI-E包括x1、x4、x8、x16几种规格，其中供显卡使用的是PCI-E x16，接口带宽可达8GB/s，远远超过只有2.1GB/s带宽的AGP 8x，它不仅解决了显卡和主板之间带宽不足的问题还增强了对显卡的供电能力。

【AGP】AGP是Accelerated Graphics Port(加速图形端口)的缩写，是前几年显卡接口。AGP接口历经了AGP 1.0(1x/2x)、AGP 2.0(4x)、AGP 3.0(8x)几个发展阶段，带宽从最早的AGP 1x(66MHz)，266MB/S的带宽发展到了最高规格的AGP 8x(533MHz)，2.13GB/S的带宽。但是AGP 8x接口也成为显卡发展的瓶颈，因此在2006年被PCI-E接口完全取代。

●着色单元/Shaders：此处显示GPU拥有的着色器的数量。
【流处理器】先来介绍下“统一架构”的流处理器的由来。传统管线架构：以往显卡由顶点渲染管线和像素渲染管线组成，生成图像的过程都是先由顶点渲染管线中的Vertex Shader（顶点着色器）生成基础的几何图形骨架（由三角形构成），然后再由像素渲染管线中的Pixel Shader（像素着色器）进行填色，最后才是像素渲染管线中的纹理单元进行贴图。而当新的统一渲染架构提出之后，顶点着色器和像素着色器被合二为一，成为流处理器（Shaders），它将同时负责顶点着色和像素着色，避免了负载不均衡的情况发生。最先提出统一渲染架构的是微软的DirectX 10。需要说明的是，N卡和A卡的所采取的核心架构是不一样的，N卡采用的是MIMD架构。多指令流多数据流（Multiple InstructionStream Multiple DataStream，简称MIMD），它使用多个控制器来异步地控制多个处理器，从而实现空间上的并行性，所以N卡是一个发射器；A卡采用的是SIMD架构设计,即Single Instruction Multiple Data（单指令流多数据流），A卡是将4个简单指令+1个复杂指令打包，再用一个发射器发出。所以A/N两者不能进行流处理器数量的简单对比。

●DirectX版本/DirectX Support：此处显示GPU所支持的DirectX版本。
【DirectX】DirectX并不是一个单纯的3D API，它是由微软公司开发的用途广泛的API，包含Direct Graphics（Direct 3D+Direct Draw）、Direct Input、Direct Play、Direct Sound、Direct Show、Direct Setup、Direct Media Objects等多个组件，它提供了一整套的多媒体接口方案，只是DirectX在3D图形方面的表现最具影响力，目前主流的是DirectX 11，引入了Shader Model 5.0的全面支持，可以实现精美、逼真和复杂的3D画面。
（关于DirectX演化和新技术介绍，我会开新帖介绍，请保持关注哦。）

【Shader Model】Shader Model（在3D图形领域常被简称SM）就是“优化渲染引擎模式”。事实上，Shader（渲染或称着色）是一段能够针对3D对象进行操作、并被GPU所执行的程序。通过这些程序，程序员就能够获得绝大部分想要的3D图形效果。在一个3D场景中，一般包含多个Shader。这些Shader中有的负责对3D对象表面进行处理，有的负责对3D对象的纹理进行处理。早在微软发布DirectX 8时，Shader Model的概念就出现在其中了，并根据操作对象的不同被分为对顶点进行各种操作的Vertex Shader（顶点渲染引擎）和对像素进行各种操作的Pixel Shader（像素渲染引擎）。Shader Model 已经有五个版本了：分别是Shader Model 1.0（DirectX8.0）、Shader Model 2.0（DirectX9.0b）、Shader Model 3.0（DirectX9.0c）、Shader Model 4.0（DirectX10）、Shader Model 4.1（DirectX10.1）和Shader Model 5.0（DirectX11）。

●像素填充率/Pixel Fillrate：此处显示GPU的像素填充率。
【像素填充率】像素填充率是指图形处理单元在每秒内所渲染的像素数量，是决定一块3D显卡在各种分辨率下的性能表现的一个重要参数，它的值越大，显卡核心性能就越好，单位是GPixel/S（每秒十亿纹理）
核心像素填充率＝核心频率×光栅单元数目/1000

●纹理填充率/Texture Fillrate：此处显示GPU的纹理填充率。
【纹理填充速率】是指在多边形每个面上填充的颜色的纹理，单位是GPixel/S（每秒十亿像素）
纹理填充率＝核心频率×纹理单元数目/1000

这两个参数的值在GPU-Z中自然是越大则越能表明显卡所能处理的能力越强悍。并且核心频率是像素填充率（Pixel Fillrate）和纹理填充率（Texture Fillrate）的计算因数，显然显卡核心频率越高，这两个值越大。而其中的光栅单元数目即ROPs的值，ROPs的值越大，像素填充率也就越大。

④.显存信息部分：

●显存类型/Memory Type：此处显示显卡所采用的显存类型，如：GDDR3、GDDR5等。

【GDDR】即Graphics DDR SDRAM，是用于显卡领域的DDR SDRAM。DDR SDRAM是Double Data Rate SDRAM的缩写，意为双倍速率同步动态随机存储器，在一个时钟周期内传输两次数据，性能比老式SDRAM强很多。

【GDDR2】相对GDDR，GDDR2显存加入了多路复用技术，在不改变外部数据带宽和显存颗粒工作频率的情况下，数据传输带宽比GDDR显存提升一倍。但存在发热量较高的问题。

【GDDR3】在GDDR2的基础上，GDDR3显存发热量得到了控制，并且工作频率更高。GDDR3显存的工作频率可以轻松突破1GHz，从而使显存的带宽更高。GDDR3显存的功耗仅为普通GDDR的一半，发热量更低。由于高性能的GDDR5显存普及，GDDR3已经成为目前较低端显卡使用的显存。

【GDDR4】GDDR4属于双倍数据率内存，通过使用Cutting-edge技术的Data Bus Inversion及Multi-Preamble技术，使其在理论上相对GDDR3的运行效率提升了56%，使用GDDR4显存能达到更高的工作频率和更强的实际性能。但是DDR4的延迟是要大于DDR3的，无论DDR3,DDR4,只要频率高的性能就高。所谓延迟是高频率DDR必定有的东西。同频率显卡自然是延迟低的好，不同频率的就是高频的好。GDDR4只是过渡产品，GDDR5时代已经到来。

【GDDR5】与GDDR4相比，GDDR5的最大亮点就是带宽更高了，从16GB/s升至20GB/s，同时虽然电压还是保持在1.5V，但功耗会更低，因为GDDR5会自动降低空闲显存的频率，并支持错误纠正、适应性界面计时等多种新技术。按照奇梦达的说法，GDDR5的性能可达GDDR3的三倍。目前主流显卡都已经使用了高速的GDDR5显存。

●显存位宽/Bus Width：此处显示GPU与显存之间连接的带宽。
【显存位宽】Bus Width（位宽）往往是玩家最容易忽视的一个概念。显存位宽是显存在一个时钟周期内所能传送数据的位数，位数越大则瞬间所能传输的数据量越大。可以说显存位宽对显卡性能的影响相比显存容量而言要大不少。显卡显存位宽的权重到底有多大，举个例子：HD 6850 > HD 6790 > GTX 550 Ti > HD 5770。我们重点关注下HD6790和GTX550Ti这两款显卡，虽然说GTX 550 Ti在核心频率和ROPs数量上均高于HD 6790，但是在大部分的测试项目中为何又败下阵来了？首先HD 6790采用的HD 6850的缩减核心架构这一点自然不用说，其二就在显存位宽上，550 Ti仅为192Bit位的显存位宽，所以显存带宽的处理能力仅为98.4GB/S，而HD 6790则采用的是256Bit的显存位宽，显存带宽处理能力达到了134.4GB/S，相比550 Ti提升36.58%。而为什么550Ti相比HD 5770来说，又能够将HD 5770全面压制了，其实道理也是一样的。从显存带宽（Bandwidth）＝（显存位宽 ×显存工作频率）/ 8 这个公式我们也可以看到当都采用GDDR5显存颗粒的时候，显存位宽就成为了影响性能的关键瓶颈。

另外需要说明一点，目前中端显卡显存位宽基本都是128-bits，如HD 6770，由于采用了GDDR5显存，其显存带宽值达到了76.8GB/s；而使用GDDR3，但显存位宽256-bits的9800GTX+才70.4GB/s，带宽值还不如前者（后面还会详细解释）。所以相同显存类型下才可以对比位宽的，否则没有意义。

●显存容量/Memory Size：此处显示显卡板载的物理显存容量。
【显存】显存也称帧缓存，在CPU和图形核心的数据交换过程中充当缓冲角色，同时显存还可作为图形芯片3D运算的数据缓存。图形核心的运作速度越快，对显存速度的要求便越高，这便是高端显卡往往配合大容量、高速度的高级显存的原因。
【显存容量】显存容量的大小决定着显存临时存储数据的能力，在一定程度上也会影响显卡的性能。显存容量也是随着显卡的发展而逐步增大的，并且有越来越增大的趋势。显存容量从早期的512KB、1MB等极小容量，发展到128MB、256MB，一直到目前主流的512MB、1024MB，高端显卡甚至已经具有1.5GB以上的显存了。值得注意的是，现在游戏在开了高分辨和高抗锯齿、高各向异性过滤后，会占用很大的显存容量，举个例子，1920x1080的分辨率下，一般要求显存容量为1G，才不会由于显存过小导致GPU性能难以发挥。另外就是有些低端入门级显卡，或者是一些移动平台的显卡，搭配了大容量显存，实际上是没有意义的。容量大小与GPU性能挂钩才能不浪费显存。

我们需要提醒玩家注意的是显存容量这个最经典的“骗局”，就是利用A卡的Hyper Memory（HM）或N卡的Turbo Cache(TC)的动态共享系统内存技术来谎称显卡的显存容量，想必这样的招数在进过前些年的“洗礼”之后，现在的不少消费者也逐渐对这样的雕虫小技都能够很快的精准识别。

●显存带宽/Bandwidth：此处显示GPU-Z与显存之间的数据传输速度。
【显存带宽】是指芯片和显存之间的数据传输速率，以GB/s为单位。显存带宽是决定显卡性能和数据最重要的因素之一。随着图形芯片的发展，需要的显存带宽也越来越大。
显存带宽（Bandwidth）＝（显存位宽 ×显存工作频率）/ 8

GDDR5相对于GDDR3的核心优势在于显存带宽大幅度提升。从上面的计算公司我们可以清楚的看到，由于GDDR5显存颗粒具备两条数据总线，所以虽然采用的是和GDDR3同样的8位预取机制，但显存的工作频率可以到达GDDR3的两倍。最为典型的一个例子就是：采用GDDR5显存的GT240显卡要比采用GDDR3显存的GT240显卡性能领先16%左右，所以凭借强大的带宽优势，GDDR5在同位宽的情况下可以全面超越GDDR3。

⑤.驱动部分：

●驱动程序版本/Driver Version：此处为系统内当前使用的显卡驱动的版本号/斜杠后面显示你的操作系统。
【驱动程序】Device Driver，是一种特殊的程序，其最重要的作用是将硬件本身的功能告诉操作系统，其次是完成硬件设备电子信号与操作系统及软件的高级编程语言之间的相互翻译。简单地说，驱动程序提供了硬件到操作系统的接口，并且负责协调二者之间的关系。正因为驱动程序有如此重要的作用，所以它被称为“硬件的灵魂”。NVIDIA和AMD分别为各自的显卡提供了“ForceWare”和“Catalyst（催化剂）”驱动程序，并且对其定期进行更新，对显卡做针对性的优化，用于解决存在的问题和进一步提高性能。所以我们推荐大家选择最新版的WHQL版驱动，最新版本的可以到本楼最上方链接的帖子中下载。

jasu30 · 发表于 2011-5-5 01:40

本帖最后由 jasu30 于 2011-7-22 00:13 编辑

⑥.显卡频率部分：

●核心频率/GPU Clock：显示GPU当前的运行频率。
【核心频率】指图形核心的工作频率。核心频率的高低在一定程度上能够反映图形核心的性能，而提升核心频率也是显卡超频的主要方法之一。不过显卡的性能是由多方面共同决定的，只有在同样级别的图形核心中，核心频率高的性能才会更好，因此核心频率高并不一定代表显卡性能强劲。

●默认核心频率/Default Clock：显示GPU默认的运行频率。可以和上面那项当前频率做对比

●显存（频率）/Memory (Clock)：显示显存当前的运行频率。
【显存频率】是指显存的时钟频率，以MHz或者GHz为单位。关于GDDR5显存频率，由于以往GDDR1/2/3/4和DDR1/2/3的数据总线都是采用的DDR技术(通过差分时钟在上升沿和下降沿各传输一次数据)，官方标称的频率X2就是数据传输率，也就是通常我们所说的等效频率。而GDDR5则不同，它有两条数据总线，相当于Rambus的QDR技术，所以官方标称频率X4才是数据传输率。比如GTX 560 Ti官方显存频率是1000MHz，而大家习惯称之为4000MHz。
即GDDR5等效频率=框中数值 X 4
GDDR、GDDR2、GDDR3、GDDR4等效频率=框中数值 X 2

●（默认）显存（频率）/(Default) Memory (Clock)：显示显存默认的运行频率。

●着色器（频率）/Shader (Clock)：显示着色器（也叫着色单元）当前的运行频率。
【着色器频率】从GeForce 8800GTX开始，由于核心频率受制于制造工艺无法进一步提升，而着色器由于结构简单，频率提升相对容易得多。为了实现更高的渲染效率，NVIDIA把着色器频率从核心频率中分离出来，频率是核心频率的两倍。需要说明的是，由于核心架构的设计不同，A卡的GPU核心频率和Shader频率是一致的。

●（默认）着色器（频率）/Shader (Clock)：显示着色单元默认的运行频率。

显卡的频率，我们主要关注的是核心频率和显存频率。两者相比较而言，核心频率对显卡性能的影响权重较大（超频测试中证实）。所以我们玩家在超频的时候先提升的核心频率，再才是显存频率。有个问题我们需要提出来讨论一下：显卡频率是不是越高越好？
从旗舰显卡的频率设定来看，它们的核心频率设定都不是特别高，而且前段时间也爆出：AMD对HD6990因超频而致使显卡损坏的显卡用户不予质保，同时也有国外媒体在测试GTX590显卡的时候所出现的“烧毁”显卡的现象。由此可见，高频设定的高端显卡由于GPU核心温度的极高无比而致使显卡烧毁这样的一种玩卡方式确实有些不大妥当。毕竟玩家还是自己的显卡能够稳定运行。当然，在中端显卡上我们也可以看到风冷情况下高频设定的显卡，例如新近推出的GTX 550 Ti，1G核心频率设定的显卡产品也有一些。高频显卡的意义何在，从另一个角度去分析：不妨作为一种检测显卡品质的方法，因为能够在高频下运行的显卡需要很好的做工和强劲的显卡散热器做支持。其实我们玩家在大部分情况下应用的也就是显卡的默认频率设定，所以高频设定的显卡，我们也很担心其寿命的长短。故而我们并不推荐玩家刻意的追求极致高频，除非你是一个狂热的超频玩家。

⑦交火和运算能力部分：

●NVIDIA SLI或ATI Crossfire：显示是否开启SLI或者Crossfire多显卡交火。
【SLI】Scalable Link Interface（交错互联接口），是有NVIDIA公司开发的多显卡互联技术，用以提高图形系统的处理能力，需主板和显卡共同支持。两块型号相同的GeForce显卡通过专用的桥接线连接或PCI-E总线连接和交换数据，根据主板不同，两块显卡都将享有PCI-E x8或者PCI-E x16通道。SLI由驱动程序智能分配任务，主卡负责整体协调工作，副卡从主卡接受任务，并向主卡返回处理结果。由两块显卡组成的SLI系统大约能提供1.6倍以上的单卡性能，不过显卡成本也因此成倍上涨。

【CrossFire X】不是《穿越火线》游戏哦。CrossFire X（交叉火力）由ATI开发的多显卡互联技术。与NVIDIA的SLI相同，CrossFire也需要显卡与主板的共同支持。两卡通过专用的CF桥接线相连，副卡将处理好的数据信号交给主卡，并有主卡合成输出。目前在售的Cayman和Barts核心的HD 6900、HD 6800系列显卡在双卡并联交火后，性能出现突飞猛进的增长，部分成绩相对单卡提升2倍还多，成为显卡市场上的一段佳话。

SLI和CrossFire技术提供了多卡互联的技术解决方案。关于什么样的显卡组建多卡互联系统会显得更具性价比？我建议采用中段显卡组建系统会显的更划算一些，当然资金充裕的话，采用中高端显卡来组建多卡互联系统也可以，如果采用低端的显卡来组建交火的话，这样就不大太划算，因为可能低端显卡组建的平台性能优势才仅仅相当于中端卡的能力，而价格却已经超过了单块中端显卡的价钱。

（左：双卡SLI 右：三卡SLI）

（左：4路GTX 580 SLI 右：AMD CrossFire）

●运算能力/Computing：显示是否具备OpenCL、CUDA、PhysX和DirectCompute 5.0运算能力。

【OpenCL】OpenCL(全称Open Computing Language，开放运算语言)是第一个面向异构系统通用目的并行编程的开放式、免费标准，也是一个统一的编程环境，便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码，而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器，在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景。OpenCL工作组的成员包括：3Dlabs、AMD、苹果、ARM、Codeplay、爱立信、飞思卡尔、Graphic Remedy、IBM、Imagination Technologies、Intel、诺基亚、NVIDIA、摩托罗拉、QNX、高通，三星、Seaweed、德州仪器和瑞典Ume大学等，不过微软并不在其列。

【CUDA】计算行业正在从只使用CPU的“中央处理”向CPU与GPU并用的“协同处理”发展。为打造这一全新的计算典范，NVIDIA发明了CUDA(Compute Unified Device Architecture)并行计算架构，该架构现已应用于GeForce（精视）、ION（翼扬）、Quadro以及Tesla GPU（图形处理器）上，它包含了CUDA指令集架构（ISA）以及GPU内部的并行计算引擎。开发人员现在可以使用C语言、C++语言来为CUDA架构编写程序，C语言、C++语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA的处理器上以超高性能运行。将来还会支持其它语言，包括FORTRAN等等。

关于CUDA的应用，已经有网友发帖子介绍了，大家可以去看看：http://bbs.pceva.com.cn/viewthread.php?tid=14349&

【PhysX】读音与Physics相同，是一套由AGEIA（音译为“阿吉亚”或“奥加”）公司开发的物理运算引擎；也是世界三大物理运算引擎之一，另外两种是Havok（被Intel收购）和Bullet（AMD采用的开源物理引擎方案）。由于PhysX物理引擎在设计上就并不适合用CPU去计算，因此AGEIA公司还为PhysX引擎设计了专门的运算硬件，PhysX物理加速卡。PhysX物理加速卡的核心被称为PPU，即物理处理器（Physics processing Unit）。2008年，在Intel收购了物理引擎界的领军者Havok后，NVIDIA也收购了排名第二的AGEIA，正式将PhysX技术划入旗下。

物理运算引擎的作用，简而言之，就是令虚拟世界中的物体运动符合真实世界的物理定律，以使游戏更加富有真实感，包括剧烈的爆炸、可在外力下做出反应的碎片、逼真的水效果以及栩栩如生的人物。物理模拟计算需要非常强大的整数和浮点计算能力，具有高度的并行性，需要多线程计算，演算非常复杂，需要消耗很多资源。PhysX可以由CPU计算，但是效果很不好。但其程序本身在设计上还可以调用独立的浮点处理器（例如GPU和PPU）来计算，也正因为如此，NVIDIA的GPU可以轻松完成像流体力学模拟那样的大计算量的物理模拟计算。

无奈的是NVIDIA不愿意将PhysX技术公开，AMD的显卡是不能使用显卡运算PhysX的，开启PhysX只能使用效率低下的CPU进行物理运算，测试成绩很不理想，连24帧的及格成绩都没达到。一度出现了某网站小编利用这点，发出经典评测《GT 240秒HD 5970~》成为众人笑柄。之前是国外达人通过破解驱动，现在是主板提供Lucid芯片，可以使用AMD显卡执行图形渲染做主卡、辅以NVIDIA显卡进行PhysX物理加速，实现“混合交火”。

PhysX详细介绍：http://bbs.pceva.com.cn/thread-19264-1-1.html

【DirectCompute 5.0】随着业界对GPU通用计算技术的认可与重视，不同的厂商开始提供不同的GPU通用计算API解决方案。其中NVIDIA最先提出CUDA，但是CUDA是一种基于CUDA架构的私有标准，非CUDA架构的GPU（例如AMD GPU）无法使用。除了CUDA外，还有OpenCL，他是由苹果提出的，得到业界多家厂商支持的开放标准。但是OpenCL的成员中并不包括微软，作为业界的领军者，微软自己推出了DirectCompute，并集成在DirectX内。当然DirectCompute也是一种开放的标准，由于微软在业界的地位，NVIDIA和AMD均提供对DirectCompute 的支持。

另外，NVIDIA CUDA只是面向GPU通用计算，而OpenCL和DirectCompute则在面向GPU通用计算的同时，还支持CPU+GPU异构运算。因此NVIDIA在不断发展自身CUDA的同时，也要同时兼顾对OpenCL和Directcompute的支持。因为任何私有标准都是没有前途的。

DirectCompute是Windows 7操作系统里最重要的一个组成部分，DirectX 11内集成Directcompute 5.0。在Windows 7中，CPU与GPU组成了协同处理环境。它们的分工是，CPU运算非常复杂的序列代码，而GPU则运行大规模并行应用程序。因此，在Windows 7，CPU与GPU功能平衡，可以提供更快、更可视化的Windows 7体验。也标志着主流的桌面级操作系统开始迈向异构通用计算。

NVIDIA Geforce8系列，9系列，GT200系列，GT400系列，GT500系列，ION系列。AMD Radeon HD4000系列，HD5000系列，HD6000系列显卡均提供最Directcompute的硬件支持。

更多DirectCompute的应用支持可到百度百科中获得：http://baike.baidu.com/view/3245449.html

jasu30 · 发表于 2011-5-5 01:45

本帖最后由 jasu30 于 2011-5-11 14:53 编辑

4

jasu30 · 发表于 2011-5-5 01:45

占楼备用

jasu30 · 发表于 2011-5-5 01:50

占楼备用

jasu30 · 发表于 2011-5-5 19:22

占楼备用

jasu30 · 发表于 2011-5-5 19:22

占楼备用

jasu30 · 发表于 2011-5-5 19:22

占楼备用

vanechka · 发表于 2011-5-8 16:45

好贴学习了

jasu30 · 发表于 2011-5-8 16:47

好贴学习了
vanechka 发表于 2011-5-8 16:45

呵呵，过一段整理清楚了再来看看吧

vanechka · 发表于 2011-5-8 16:49

前面那些都已经不错了名词解释啊哈哈希望回复没影响你占楼

jasu30 · 发表于 2011-5-8 16:56

前面那些都已经不错了名词解释啊哈哈希望回复没影响你占楼
vanechka 发表于 2011-5-8 16:49

不会不会，等我整理好了第一个通知你，嘿嘿

世纪冰雷 · 发表于 2011-5-11 23:16

这个比中文版GPUZ给力多了~

jasu30 · 发表于 2011-5-11 23:21

前面那些都已经不错了名词解释啊哈哈希望回复没影响你占楼
vanechka 发表于 2011-5-8 16:49

搞定一部分，有空继续搞其他的。。

sapphirex · 发表于 2011-5-13 16:11

这个不错。。来学习下

lk111wlq · 发表于 2011-5-13 20:51

正在被考试、论文搞的水深火热的难民噜过

kanon421 · 发表于 2011-5-14 11:29

写得很少顶起来收藏

jasu30 · 发表于 2011-5-14 11:32

写得很少顶起来收藏
kanon421 发表于 2011-5-14 11:29

很少？？

ach9999 · 发表于 2011-5-14 19:13

我也要多复习一下这些名词也经常忘记定义 - -

初学者看过来——常用【名词解释】汇总——教你认识显卡

评分

通过GPU-Z认识你的显卡（上）

本帖子中包含更多资源

通过GPU-Z认识你的显卡（下）

本帖子中包含更多资源