显卡全方位术语详解.docx
- 文档编号:10581026
- 上传时间:2023-02-21
- 格式:DOCX
- 页数:39
- 大小:395.89KB
显卡全方位术语详解.docx
《显卡全方位术语详解.docx》由会员分享,可在线阅读,更多相关《显卡全方位术语详解.docx(39页珍藏版)》请在冰豆网上搜索。
显卡全方位术语详解
显卡全方位术语详解
来源:
中关村在线作者:
佚名
显卡:
核心频率
显卡的核心频率是指显示核心的工作频率,其工作频率在一定程度上可以反映出显示核心的性能,但显卡的性能是由核心频率、显存、像素管线、像素填充率等等多方面的情况所决定的,因此在显示核心不同的情况下,核心频率高并不代表此显卡性能强劲。
比如9600PRO的核心频率达到了400MHz,要比9800PRO的380MHz高,但在性能上9800PRO绝对要强于9600PRO。
在同样级别的芯片中,核心频率高的则性能要强一些,提高核心频率就是显卡超频的方法之一。
显示芯片主流的只有ATI和NVIDIA两家,两家都提供显示核心给第三方的厂商,在同样的显示核心下,部分厂商会适当提高其产品的显示核心频率,使其工作在高于显示核心固定的频率上以达到更高的性能。
显卡:
显存类型
显存是显卡上的关键核心部件之一,它的优劣和容量大小会直接关系到显卡的最终性能表现。
可以说显示芯片决定了显卡所能提供的功能和其基本性能,而显卡性能的发挥则很大程度上取决于显存。
无论显示芯片的性能如何出众,最终其性能都要通过配套的显存来发挥。
显存,也被叫做帧缓存,它的作用是用来存储显卡芯片处理过或者即将提取的渲染数据。
如同计算机的内存一样,显存是用来存储要处理的图形信息的部件。
我们在显示屏上看到的画面是由一个个的像素点构成的,而每个像素点都以4至32甚至64位的数据来控制它的亮度和色彩,这些数据必须通过显存来保存,再交由显示芯片和CPU调配,最后把运算结果转化为图形输出到显示器上。
目前市场上主要以DDRII,DDRIII为主。
而新一代的芯片则支持DDR4显存。
显卡:
显存频率
显存频率是指默认情况下,该显存在显卡上工作时的频率,以MHz(兆赫兹)为单位。
显存频率一定程度上反应着该显存的速度。
显存频率随着显存的类型、性能的不同而不同,SDRAM显存一般都工作在较低的频率上,一般就是133MHz和166MHz,此种频率早已无法满足现在显卡的需求。
DDRSDRAM显存则能提供较高的显存频率,主要在中低端显卡上使用,DDR2显存由于成本高并且性能一般,因此使用量不大。
DDR3显存是目前高端显卡采用最为广泛的显存类型。
不同显存能提供的显存频率也差异很大,主要有400MHz、500MHz、600MHz、650MHz等,高端产品中还有800MHz、1200MHz、1600MHz,甚至更高。
显存频率与显存时钟周期是相关的,二者成倒数关系,也就是显存频率=1/显存时钟周期。
如果是SDRAM显存,其时钟周期为6ns,那么它的显存频率就为1/6ns=166MHz。
而对于DDRSDRAM或者DDR2、DDR3,其时钟周期为6ns,那么它的显存频率就为1/6ns=166MHz,但要了解的是这是DDRSDRAM的实际频率,而不是我们平时所说的DDR显存频率。
因为DDR在时钟上升期和下降期都进行数据传输,其一个周期传输两次数据,相当于SDRAM频率的二倍。
习惯上称呼的DDR频率是其等效频率,是在其实际工作频率上乘以2,就得到了等效频率。
因此6ns的DDR显存,其显存频率为1/6ns*2=333MHz。
具体情况可以看下边关于各种显存的介绍。
但要明白的是显卡制造时,厂商设定了显存实际工作频率,而实际工作频率不一定等于显存最大频率。
此类情况现在较为常见,如显存最大能工作在650MHz,而制造时显卡工作频率被设定为550MHz,此时显存就存在一定的超频空间。
这也就是目前厂商惯用的方法,显卡以超频为卖点。
此外,用于显卡的显存,虽然和主板用的内存同样叫DDR、DDR2甚至DDR3,但是由于规范参数差异较大,不能通用,因此也可以称显存为GDDR、GDDR2、GDDR3。
显卡:
什么是SP单元
SP:
StreamProcessor。
NVIDIA对其统一架构GPU内通用标量着色器的称谓。
StreamProcessor是继PixelPipelines和VertexPipelines之后新一代的显卡渲染技术指标,StreamProcessor既可以完成VertexShader运算,也可以完成PixelShader运算,而且可以根据需要组成任意VS/PS比例,从而给开发者更广阔的发挥空间。
简而言之,过去按照固定的比例组成的渲染管线/顶点单元渲染模式如今被StreamProcessor组成的任意比例渲染管线/顶点单元渲染模式替代,StreamProcessor是全新的全能渲染单元。
显卡:
接口类型
接口类型是指显卡与主板连接所采用的接口种类。
显卡的接口决定着显卡与系统之间数据传输的最大带宽,也就是瞬间所能传输的最大数据量。
不同的接口决定着主板是否能够使用此显卡,只有在主板上有相应接口的情况下,显卡才能使用,并且不同的接口能为显卡带来不同的性能。
目前各种3D游戏和软件对显卡的要求越来越高,主板和显卡之间需要交换的数据量也越来越大,过去的显卡接口早已不能满足这样大量的数据交换,因此通常主板上都带有专门插显卡的插槽。
假如显卡接口的传输速度不能满足显卡的需求,显卡的性能就会受到巨大的限制,再好的显卡也无法发挥。
显卡发展至今主要出现过ISA、PCI、AGP、PCIExpress等几种接口,所能提供的数据带宽依次增加。
其中2004年推出的PCIExpress接口已经成为主流,以解决显卡与系统数据传输的瓶颈问题,而ISA、PCI接口的显卡已经基本被淘汰。
目前市场上显卡一般是AGP和PCI-E这两种显卡接口。
AGP是AcceleratedGraphicsPort(图形加速端口)的缩写,是显示卡的专用扩展插槽,它是在PCI图形接口的基础上发展而来的。
AGP规范是英特尔公司解决电脑处理(主要是显示)3D图形能力差的问题而出台的。
AGP并不是一种总线,而是一种接口方式。
随着3D游戏做得越来越复杂,使用了大量的3D特效和纹理,使原来传输速率为133MB/sec的PCI总线越来越不堪重负,籍此原因Intel才推出了拥有高带宽的AGP接口。
这是一种与PCI总线迥然不同的图形接口,它完全独立于PCI总线之外,直接把显卡与主板控制芯片联在一起,使得3D图形数据省略了越过PCI总线的过程,从而很好地解决了低带宽PCI接口造成的系统瓶颈问题。
可以说,AGP代替PCI成为新的图形端口是技术发展的必然.
PCIExpress(以下简称PCI-E)采用了目前业内流行的点对点串行连接,比起PCI以及更早期的计算机总线的共享并行架构,每个设备都有自己的专用连接,不需要向整个总线请求带宽,而且可以把数据传输率提高到一个很高的频率,达到PCI所不能提供的高带宽。
相对于传统PCI总线在单一时间周期内只能实现单向传输,PCI-E的双单工连接能提供更高的传输速率和质量,它们之间的差异跟半双工和全双工类似。
PCI-E的接口根据总线位宽不同而有所差异,包括X1、X4、X8以及X16,而X2模式将用于内部接口而非插槽模式。
PCI-E规格从1条通道连接到32条通道连接,有非常强的伸缩性,以满足不同系统设备对数据传输带宽不同的需求。
此外,较短的PCI-E卡可以插入较长的PCI-E插槽中使用,PCI-E接口还能够支持热拔插,这也是个不小的飞跃。
PCI-EX1的250MB/秒传输速度已经可以满足主流声效芯片、网卡芯片和存储设备对数据传输带宽的需求,但是远远无法满足图形芯片对数据传输带宽的需求。
因此,用于取代AGP接口的PCI-E接口位宽为X16,能够提供5GB/s的带宽,即便有编码上的损耗但仍能够提供约为4GB/s左右的实际带宽,远远超过AGP8X的2.1GB/s的带宽。
尽管PCI-E技术规格允许实现X1(250MB/秒),X2,X4,X8,X12,X16和X32通道规格,但是依目前形式来看,PCI-EX1和PCI-EX16已成为PCI-E主流规格,同时很多芯片组厂商在南桥芯片当中添加对PCI-EX1的支持,在北桥芯片当中添加对PCI-EX16的支持。
除去提供极高数据传输带宽之外,PCI-E因为采用串行数据包方式传递数据,所以PCI-E接口每个针脚可以获得比传统I/O标准更多的带宽,这样就可以降低PCI-E设备生产成本和体积。
另外,PCI-E也支持高阶电源管理,支持热插拔,支持数据同步传输,为优先传输数据进行带宽优化。
在兼容性方面,PCI-E在软件层面上兼容目前的PCI技术和设备,支持PCI设备和内存模组的初始化,也就是说过去的驱动程序、操作系统无需推倒重来,就可以支持PCI-E设备。
目前PCI-E已经成为显卡的接口的主流,不过早期有些芯片组虽然提供了PCI-E作为显卡接口,但是其速度是4X的,而不是16X的,例如VIAPT880Pro和VIAPT880Ultra,当然这种情况极为罕见。
显卡:
显示芯片
显示芯片是显卡的核心芯片,它的性能好坏直接决定了显卡性能的好坏,它的主要任务就是处理系统输入的视频信息并将其进行构建、渲染等工作。
显示主芯片的性能直接决定了显示卡性能的高低。
不同的显示芯片,不论从内部结构还是其性能,都存在着差异,而其价格差别也很大。
显示芯片在显卡中的地位,就相当于电脑中CPU的地位,是整个显卡的核心。
因为显示芯片的复杂性,目前设计、制造显示芯片的厂家只有NVIDIA、ATI、SIS、VIA等公司。
家用娱乐性显卡都采用单芯片设计的显示芯片,而在部分专业的工作站显卡上有采用多个显示芯片组合的方式。
NV部分芯片(点小图看大图)
显卡:
显存位宽
显存位宽是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一。
目前市场上的显存位宽有64位、128位和256位三种,人们习惯上叫的64位显卡、128位显卡和256位显卡就是指其相应的显存位宽。
显存位宽越高,性能越好价格也就越高,因此256位宽的显存更多应用于高端显卡,而主流显卡基本都采用128位显存。
大家知道显存带宽=显存频率X显存位宽/8,那么在显存频率相当的情况下,显存位宽将决定显存带宽的大小。
比如说同样显存频率为500MHz的128位和256位显存,那么它俩的显存带宽将分别为:
128位=500MHz*128∕8=8GB/s,而256位=500MHz*256∕8=16GB/s,是128位的2倍,可见显存位宽在显存数据中的重要性。
显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成,。
显存位宽=显存颗粒位宽×显存颗粒数。
显存颗粒上都带有相关厂家的内存编号,可以去网上查找其编号,就能了解其位宽,再乘以显存颗粒数,就能得到显卡的位宽。
这是最为准确的方法,但施行起来较为麻烦。
显卡:
什么是OpenGL
OpenGL是个专业的3D程序接口,是一个功能强大,调用方便的底层3D图形库。
OpenGL的前身是SGI公司为其图形工作站开发的IRISGL。
IRISGL是一个工业标准的3D图形软件接口,功能虽然强大但是移植性不好,于是SGI公司便在IRISGL的基础上开发了OpenGL。
OpenGL的英文全称是“OpenGraphicsLibrary”,顾名思义,OpenGL便是“开放的图形程序接口”。
虽然DirectX在家用市场全面领先,但在专业高端绘图领域,OpenGL是不能被取代的主角。
OpenGL是个与.硬件无关的软件接口,可以在不同的平台如Windows95、WindowsNT、Unix、Linux、MacOS、OS/2之间进行移植。
因此,支持OpenGL的软件具有很好的移植性,可以获得非常广泛的应用。
由于OpenGL是3D图形的底层图形库,没有提供几何实体图元,不能直接用以描述场景。
但是,通过一些转换程序,可以很方便地将AutoCAD、3DS等3D图形设计软件制作的DFX和3DS模型文件转换成OpenGL的顶点数组。
在OpenGL的基础上还有OpenInventor、Cosmo3D、Optimizer等多种高级图形库,适应不同应用。
其中,OpenInventor应用最为广泛。
该软件是基于OpenGL面向对象的工具包,提供创建交互式3D图形应用程序的对象和方法,提供了预定义的对象和用于交互的事件处理模块,创建和编辑3D场景的高级应用程序单元,有打印对象和用其它图形格式交换数据的能力。
OpenGL的发展一直处于一种较为迟缓的态势,每次版本的提高新增的技术很少,大多只是对其中部分做出修改和完善。
1992年7月,SGI公司发布了OpenGL的1.0版本,随后又与微软公司共同开发了WindowsNT版本的OpenGL,从而使一些原来必须在高档图形工作站上运行的大型3D图形处理软件也可以在微机上运用。
1995年OpenGL的1.1版本面市,该版本比1.0的性能有许多提高,并加入了一些新的功能。
其中包括改进打印机支持,在增强元文件中包含OpenGL的调用,顶点数组的新特性,提高顶点位置、法线、颜色、色彩指数、纹理坐标、多边形边缘标识的传输速度,引入了新的纹理特性等等。
OpenGL1.5又新增了“OpenGLShadingLanguage”,该语言是“OpenGL2.0”的底核,用于着色对象、顶点着色以及片断着色技术的扩展功能。
OpenGL2.0标准的主要制订者并非原来的SGI,而是逐渐在ARB中占据主动地位的3Dlabs。
2.0版本首先要做的是与旧版本之间的完整兼容性,同时在顶点与像素及内存管理上与DirectX共同合作以维持均势。
OpenGL2.0将由OpenGL1.3的现有功能加上与之完全兼容的新功能所组成(如图一)。
借此可以对在ARB停滞不前时代各家推出的各种纠缠不清的扩展指令集做一次彻底的精简。
此外,硬件可编程能力的实现也提供了一个更好的方法以整合现有的扩展指令。
目前,随着DirectX的不断发展和完善,OpenGL的优势逐渐丧失,至今虽然已有3Dlabs提倡开发的2.0版本面世,在其中加入了很多类似于DirectX中可编程单元的设计,但厂商的用户的认知程度并不高,未来的OpenGL发展前景迷茫。
显卡:
什么是DirectX
DirectX并不是一个单纯的图形API,它是由微软公司开发的用途广泛的API,它包含有DirectGraphics(Direct3D+DirectDraw)、DirectInput、DirectPlay、DirectSound、DirectShow、DirectSetup、DirectMediaObjects等多个组件,它提供了一整套的多媒体接口方案。
只是其在3D图形方面的优秀表现,让它的其它方面显得暗淡无光。
DirectX开发之初是为了弥补Windows3.1系统对图形、声音处理能力的不足,而今已发展成为对整个多媒体系统的各个方面都有决定性影响的接口。
DirectX5.0
微软公司并没有推出DirectX4.0,而是直接推出了DirectX5.0。
此版本对Direct3D做出了很大的改动,加入了雾化效果、Alpha混合等3D特效,使3D游戏中的空间感和真实感得以增强,还加入了S3的纹理压缩技术。
同时,DirectX5.0在其它各组件方面也有加强,在声卡、游戏控制器方面均做了改进,支持了更多的设备。
因此,DirectX发展到DirectX5.0才真正走向了成熟。
此时的DirectX性能完全不逊色于其它3DAPI,而且大有后来居上之势。
DirectX6.0
DirectX6.0推出时,其最大的竞争对手之一Glide,已逐步走向了没落,而DirectX则得到了大多数厂商的认可。
DirectX6.0中加入了双线性过滤、三线性过滤等优化3D图像质量的技术,游戏中的3D技术逐渐走入成熟阶段。
DirectX7.0
DirectX7.0最大的特色就是支持T&L,中文名称是“坐标转换和光源”。
3D游戏中的任何一个物体都有一个坐标,当此物体运动时,它的坐标发生变化,这指的就是坐标转换;3D游戏中除了场景+物体还需要灯光,没有灯光就没有3D物体的表现,无论是实时3D游戏还是3D影像渲染,加上灯光的3D渲染是最消耗资源的。
虽然OpenGL中已有相关技术,但此前从未在民用级硬件中出现。
在T&L问世之前,位置转换和灯光都需要CPU来计算,CPU速度越快,游戏表现越流畅。
使用了T&L功能后,这两种效果的计算用显示卡的GPU来计算,这样就可以把CPU从繁忙的劳动中解脱出来。
换句话说,拥有T&L显示卡,使用DirectX7.0,即使没有高速的CPU,同样能流畅的跑3D游戏。
DirectX8.0
DirectX8.0的推出引发了一场显卡革命,它首次引入了“像素渲染”概念,同时具备像素渲染引擎(PixelShader)与顶点渲染引擎(VertexShader),反映在特效上就是动态光影效果。
同硬件T&L仅仅实现的固定光影转换相比,VS和PS单元的灵活性更大,它使GPU真正成为了可编程的处理器。
这意味着程序员可通过它们实现3D场景构建的难度大大降低。
通过VS和PS的渲染,可以很容易的宁造出真实的水面动态波纹光影效果。
此时DirectX的权威地位终于建成。
DirectX9.0
2002年底,微软发布DirectX9.0。
DirectX9中PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元也被取消。
全新的VertexShader(顶点着色引擎)编程将比以前复杂得多,新的VertexShader标准增加了流程控制,更多的常量,每个程序的着色指令增加到了1024条。
PS2.0具备完全可编程的架构,能对纹理效果即时演算、动态纹理贴图,还不占用显存,理论上对材质贴图的分辨率的精度提高无限多;另外PS1.4只能支持28个硬件指令,同时操作6个材质,而PS2.0却可以支持160个硬件指令,同时操作16个材质数量,新的高精度浮点数据规格可以使用多重纹理贴图,可操作的指令数可以任意长,电影级别的显示效果轻而易举的实现。
VS2.0通过增加Vertex程序的灵活性,显著的提高了老版本(DirectX8)的VS性能,新的控制指令,可以用通用的程序代替以前专用的单独着色程序,效率提高许多倍;增加循环操作指令,减少工作时间,提高处理效率;扩展着色指令个数,从128个提升到256个。
增加对浮点数据的处理功能,以前只能对整数进行处理,这样提高渲染精度,使最终处理的色彩格式达到电影级别。
突破了以前限制PC图形图象质量在数学上的精度障碍,它的每条渲染流水线都升级为128位浮点颜色,让游戏程序设计师们更容易更轻松的创造出更漂亮的效果,让程序员编程更容易。
DirectX9.0c
与过去的DirectX9.0b和ShaderModel2.0相比较,DirectX9.0c最大的改进,便是引入了对ShaderModel3.0(包括PixelShader3.0和VertexShader3.0两个着色语言规范)的全面支持。
举例来说,DirectX9.0b的ShaderModel2.0所支持的VertexShader最大指令数仅为256个,PixelShader最大指令数更是只有96个。
而在最新的ShaderModel3.0中,VertexShader和PixelShader的最大指令数都大幅上升至65535个,全新的动态程序流控制、位移贴图、多渲染目标(MRT)、次表面散射Subsurfacescattering、柔和阴影Softshadows、环境和地面阴影Environmentalandgroundshadows、全局照明(Globalillumination)等新技术特性,使得GeForce6、GeForce7系列以及RadeonX1000系列立刻为新一代游戏以及具备无比真实感、幻想般的复杂的数字世界和逼真的角色在影视品质的环境中活动提供强大动力。
因此DirectX9.0c和ShaderModel3.0标准的推出,可以说是DirectX发展历程中的重要转折点。
在DirectX9.0c中,ShaderModel3.0除了取消指令数限制和加入位移贴图等新特性之外,更多的特性都是在解决游戏的执行效率和品质上下功夫,ShaderModel3.0诞生之后,人们对待游戏的态度也开始从过去单纯地追求速度,转变到游戏画质和运行速度两者兼顾。
因此ShaderModel3.0对游戏产业的影响可谓深远。
DirectX10
在DirectX10的图形流水线体系中,最大的结构性变化就是在几何处理阶段增加了几何渲染单元(GeometryShader)。
几何渲染单元被附加在顶点渲染单元之后,但它并不像顶点渲染单元那样输出一个个顶点,而是以图元作为处理对象。
图元在层次上比顶点高一级,它由一个或多个顶点构成。
由单个顶点组成的图元被称为“点”,由两个顶点组成的图元被称为“线”,由三个顶点组成的图元被称为“三角形”。
几何渲染单元支持点、线、三角形、带邻接点的线、带邻接点的三角形等多种图元类型,它一次最多可处理六个顶点。
借助丰富的图元类型支持,几何渲染单元可以让GPU提供更精细的模型细节。
几何渲染单元赋予GPU自行创造新几何物体、为场景添加内容的神奇能力。
灵活的处理能力使GPU更加通用化,以往很多必须倚靠CPU才能完成的工作,现在完全可交由GPU处理。
如此一来,CPU就有更多时间处理人工智能、寻址等工作。
更令人惊喜的是,几何渲染单元还让物理运算的加入变得更简单,DirectX10可创建具备物理特性的盒子、模拟刚性物体,物理运算有望在它的带领下逐渐走向普及。
可以预见,借助几何渲染单元这一武器,显卡性能将产生质的飞跃,我们也将体验到速度更流畅、画面更精美、情节更细致的游戏
DirectX10.1
正如以前的DX版本一样,DX10.1也是DX10的超集,因此它将支持DirectX10的所有功能,同时它将支持更多的功能,提供更高的性能。
DX10.1的一个主要提高是改善的shader资源存取功能,在多样本AA时,在读取样本时有更好的控制能力。
除此之外,DX10.1还将可以创建定制的下行采样滤波器。
DX10.1还将有更新的浮点混合功能,对于渲染目标更有针对性,对于渲染目标混合将有新的格式,渲染目标可以实现独立的各自混合。
阴影功能一直是游戏的重要特效,Direct3D10.1的阴影滤波功能也将有所提高,从而可望进一步提高画质。
在性能方面,DirectX10.1将支持多核系统有更高的性能。
而在渲染,反射和散射时,Direct3D10.1将减少对API的调用次数,从而将获得不错的性能提升。
其他方面,DX10.1的提高也不少,包括32bit浮点滤波,可以提高渲染精确度,改善HDR渲染的画质。
完全的抗锯齿应用程序控制也将是DX10.1的亮点,应用程序将可以控制多重采样和超级采样的使用,并选择在特定场景出现的采样模板。
DX10.1将至少需要单像素四采样。
DX10.1还将引入更新的驱动模型,WDDM2.1。
与DX10的WDDM2.0相比,2.1有一些显著的提高。
首先是更多的内容转换功能,WDDM2.0支持处理一个命令或三角形后进行内容转换,而WDDM2.1则可以让内容转换即时进行。
由于GPU同时要并行处理多个线程,因此内容转换的即时性不仅可以保证转换质量,还可以提升GPU效率,减少等待时间。
另外,由于WDDM2.1支持基于过程的虚拟内存分配,处理GPU和驱动页面错误的方式也更为成熟。
显卡:
输出端口
VGA
显卡所处理的信息最终都要输出到显示器上,显卡的输出接口就是电脑与显示器之间的桥梁,它负责向显示器输
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 显卡 全方位 术语 详解