Nvidia GOU的使用.docx
- 文档编号:25565921
- 上传时间:2023-06-09
- 格式:DOCX
- 页数:21
- 大小:417.20KB
Nvidia GOU的使用.docx
《Nvidia GOU的使用.docx》由会员分享,可在线阅读,更多相关《Nvidia GOU的使用.docx(21页珍藏版)》请在冰豆网上搜索。
NvidiaGOU的使用
1.企业背景
NVIDIA公司中文名称:
英伟达™
公司总部地址:
美国加利福尼亚州圣克拉拉(与Intel相邻)
创始人和CEO:
黄仁勋先生
NVIDIA(英伟达™)公司(纳斯达克代码:
NVDA)是全球视觉计算技术的行业领袖及GPU
(图形处理器)的发明者。
作为高性能处理器的GPU可在工作站、个人计算机、游戏机和
移动设备上生成令人叹为观止的互动图形效果。
该公司专注于打造能够增强个人和专业计算平台的人机交互体验的产品。
公司的图形和
通信处理器拥有广泛的市场,已被多种多样的计算平台采用,包括个人数字媒体PC、商用
PC、专业工作站、数字内容创建系统、笔记本电脑、军用导航系统和视频游戏控制台等。
NVIDIA全球雇员数量超过5000人。
全球各地众多OEM厂商、显卡制造商、系统制造商、消费类电子产品公司都选择NVIDIA
的处理器作为其娱乐和商用解决方案的核心组件。
在PC应用领域(例如制造、科研、电子
商务、娱乐和教育等),NVIDIA公司获奖不断的图形处理器可以提供出色的性能和鲜锐的视
觉效果。
其媒体和通信处理器能够执行宽带连接和通信应用中要求十分苛刻的多媒体处理任
务,并在音频应用能力方面取得突破。
NVIDIA产品和技术的基础是NVIDIAForceware,这
是一种综合性软件套件,能够实现业内领先的图形、音频、视频、通信、存储和安全功能。
NVIDIAForceWare可以提高采用NVIDIAGeForce图形芯片和NVIDIAnForce平台解决方案的
各类台式和移动PC的工作效率、稳定性和功能。
NVIDIA公司专门打造面向计算机、消费电子和移动终端,能够改变整个行业的创新产
品。
专门打造面向计算平台、消费类电子产品和移动装置的助推行业发展的创新产品。
这些
产品家族正在改变视觉丰富和运算密集型应用例如视频游戏、电影产业、广播、工业设计、
财政模型、空间探索以及医疗成像。
此外,NVIDIA致力于研发和提供引领行业潮流的先进技术,包括NVIDIASLI技术——
能够灵活地大幅提升系统性能的革命性技术,和NVIDIAPureVideo高清视频技术。
2.核心业务
2.1商业战略
独立显卡市场占有率63%
NVIDIA的GPU产品可谓通杀绝大部分的PC平台,包括微软的Windows和Apple的平
台。
同时NVIDIA的GPU产品性能在2008年有了飞速的发展,根据官方的测试数据显示,
GeForceGTX280和260的GPU在性能上要比GeForce8800Ultra高50%。
在刚刚过去的2008
年,采用NVIDIA的芯片的独立显卡占了整个独立显卡市场的63%,相比于2007年下降了
1%,而在笔记本领域也从2007年的75%大幅下挫至63%。
独立显卡市场,尤其是笔记本领
域的竞争日趋激烈。
CUDA成为大学必修课
以取代部分CPU工作为目标的CUDA技术也在2008年正式开始了普及之路。
首先是
Photoshop最新的CS4版本已经可以通过CUDA技术现实在图片处理中CPU与GPU的协同
工作,为CUDA的推广迈出了第一步。
而根据NV官方数据显示,目前全球有超过100所大
学把CUDA的技术列入了计算机专业学生的可选课程。
而包括摩托罗拉,Chevron,GEHealth
Care等多家公司更已经把CUDA技术引入了实际应用中。
现在CUDA的架构已经能够实现对
C语言的支持,而在未来,CUDA还将实现对FORTRAN和C++语言的支持。
目标超级计算机!
Tesla来势汹汹
2008年NV发布的另一款重要产品就是Tesla。
相比于CPU的复杂指令集,GPU所采用
的指令集则相对要简单很多,因此对于GPU来说,实现超高的运算频率要比CPU容易得多。
把GPU的超高运算速度实现通用程序的处理就是Tesla的设计理念。
目前已经发布的产品已
经能够仅通过1个处理器达到4Teraflops的性能,可谓来势汹汹。
单芯片系统Tegra前景无限
在整体市道疲软的情况下,Intel的Atom热卖一下子刺激了各大IT厂商的神经,纷纷推
出了针对便携式设备的超低功耗产品。
而NVIDIA则打算以Tegra来争夺便携式设备的市场。
与Atom还有Via的NANO不同,Tegra是一款单芯片系统。
这有点类似于ARM的形式,通
过削减南北桥等耗电大户以实现超低功耗。
而根据NV的官方资料,Tegra还能实现完美播
放1080P高清电影,而Netbook,PND、PMP、PDA和手机等则是其主要的目标市场。
CUDA是未来竞争的关键
其实GPU与CPU的最关键差别之一就在于其采用的指令集。
CPU采用的是复杂指令集,
因此能够进行很多特殊的或者相当复杂的运算。
而GPU的指令集则简单很多,因此GPU对
于特定类型数据的处理速度要比CPU快很多。
CUDA技术的理念本身就是通过转换指令集,
让GPU能够实现类似于CPU的工作,达到与CPU协同处理的效果。
笔者认为,大力发展CUDA
要比研发通用型CPU有意义得多。
首先NV在GPU领域与其他厂家相比有着无可比拟的优
势,继续大力提高GPU的性能也是NV的主要任务。
通过CUDA技术让GPU运算速度较高
的特性得以发展,同时在应用领域上也能得到扩展,其本质就是让优势成为更大的优势。
虽
然目前CUDA技术还是主要用于专业领域,但是笔者相信,CUDA技术将会是NV未来几年
的发展重点,CUDA技术总会有真正普及的一天。
根据官方资料显示,目前的CUDA技术已
经能够实现对C语言的支持,在未来还可能实现对C++等其他语言的支持。
据笔者了解,目
前的windows操作系统就是用C语言编写出来的,如果CUDA技术在未来继续发展的话,不
排除会出现用GPU独立运行windows操作系统的可能性。
便携式设备带来IT行业重新洗牌
自从Netbook的概念出现以来,整个CPU业界就开始了重新洗牌。
当前CPU性能已经
过剩,而功耗和体积开始变得越来越重要,这就让VIA之类的厂商获得了新的发展机遇。
其
实台湾的VIA在大约十年前也在CPU领域中呼风唤雨,后来由于性能发展方面的原因,几
乎从市场上绝迹。
而自Netbook概念出现后,VIA就集中力量向CPU功耗和体积方面发展,
因此在当前的Netbook市场上也取得了一席之地。
而对于NV而言,这也是个十分难得的机
遇。
目前限制Netbook发展的最大问题就在于CPU配套产品发展滞后,具体来说就是显示
性能,还有南北桥功耗和体积等等。
目前主流的Netbook还是采用Intel历史久远的945平
台,其性能、功耗、体积等方面都不如人意,而以Intel目前的发展主力来看,SSD似乎更
吸引Intel的投资。
如果NV能够设计出在显示性能,主板功耗和体积都有革命性突破的产品
的话,那么笔者相信,NV将能够在未来一段时间真正摆脱被CPU巨头牵着鼻子走的困境。
Ion平台的实际性能让人相当期待。
尝试苹果模式单芯片系统前景无限
从NV的财务报告分析来看,被称为Tegra的单芯片系统似乎也是NV未来几年的发展
重点。
其实Tegra的实物早就在2008年的IDF中出现过,但是在市场上却极少见到实物产品。
据介绍,Tegra是一个单芯片系统,主要用于手机等便携式设备,其性能之强大可以达到流
畅播放1080p高清电影。
而其主要的竞争对手为ARM之类的便携式设备处理芯片。
最近笔
者在猜想,现在的Netbook似乎都太过于注重以windows作为平台,这样子毫无疑问是希
望能够让更多的消费者去接受Netbook这种新产品。
而如果把手机的平台进行优化然后移植
至Netbook上,或许会是一个不错的选择。
这个理念绝非凭空想象,苹果iPhone和Mac,
Google的G1,远一点的还有ResearchInMotion的Blackberry,这些产品的成功多少给了我
们一些提示。
随着物质生活的逐步丰盛,消费者对于产品个性化的诉求越来越高。
特别是便
携式设备,这种趋势尤其明显。
而iPhone采用一个全新的,封闭式的操作平台却取得空前
成功也透露了一个信息,只要新产品的确能够带给消费者实实在在的利益,例如丰富的操作
体验,,革命性的特殊功能,炫目的效果等等,那么消费者还是很乐意改变其消费行为的。
笔者认为这对于Netbook来说是一个很有意思的启示。
日后的Netbook有可能会向像手机一
样的单芯片系统发展。
既然Tegra的性能能够达到播放1080p的水平,如果再搭配一个类似
于iPhone一样具有革命性创意的系统的话,那个Netbook将会迎来一个全新的发展。
2.2NVIDIA品牌
NVIDIATNT
开创NVIDIA时代的产品。
NVIDIA收购著名图形芯片厂商3dfx之前,NVIDIA奠定自
己王者之路的品牌,到了TNT2时代,128位核心、支持AGP4X、支持32M显存,这些特
性都为GeForce系列的成功奠定了基础。
NVIDIAGeForce
为图形和视频所设计的GPU。
配有NVIDIAGeForce系列GPU的台式电脑和笔记
本电脑带给用户无法比拟的性能,明快的照片,高清晰的视频回放,和超真实效果的游戏。
GeForce系列的笔记本GPU还包括先进的耗电管理技术,这种技术可以在不过分耗费电池
的前提下保证高性能。
NVIDIAGoForce
为移动电话所设计的超低能耗手持GPU。
真实的流动数字电视、控制台类的3D游戏、
高保真环绕声效、流畅的DVD质量视频回放、和明快生动的照片。
所有这些都有更长的电
池寿命作保证。
NVIDIAQuadro
完整的专业解决方案带来性能突破和高质量。
所有领先的专业图形应用均通过鉴定。
专业显示部件领域的王者。
NVIDIAQuadroPlex是业内第一个专属视觉运算系统(VCS)。
NVIDIAnForce
世界上最先进的核心逻辑解决方案。
nForce媒体通信处理器(MCP)带来高带宽系统性
能、先进的网络、存储和数字媒体连接。
可以在台式电脑、笔记本电脑、工作站和服务器上
使用。
2.3NVIDIA产品
台式机产品
NVIDIA是全球第一家能够提供适用于工作和娱乐应用并且同时支持众多操作系统的全
套影院级着色三维图形解决方案的半导体公司。
其GeForce系列图形芯片(GPU)能够为娱
乐和游戏应用提供最出色的三维、二维和高清晰度电视性能,并可满足企业用户所要求的高
速性能、鲜锐视觉效果以及水晶般清晰度。
GeForce已成为全球领先PC厂商及显卡生产商
的首选品牌。
平台
数字媒体革命已经到来。
当今的用户希望获得能够处理、存储和分配大量数字化内容的
PC解决方案。
NVIDIA公司的nForce媒体和通信处理器(MCP)可以实现无以伦比的系统性
能、高速联网、扩充数字媒体连接和高保真音效。
基于NVIDIAnForceMCP的主板和PC解
决方案能够满足32位和64位计算环境对可扩充性、功能和性能的需要,是专业和家庭用户
以及游戏发烧友的理想之选。
工作站
NVIDIA公司的Quadro®产品线面向专业三维和二维图形市场。
NVIDIA凭借领先的技
术将基于Quadro的工作站解决方案与NVIDIA统一驱动架构(UDA)和nViewTM软件完美
地集成在一起,为设计、创意和科研专业人员提供了稳定的开发和应用环境。
NVIDIA还将
系列移动工作站图形芯片——NVIDIAQuadroGo纳入其工作站解决方案中,从而在移动工作
站上实现了专业工作站级的特性和性能,并为移动专业人员带来了实实在在的利益。
移动产品
NVIDIA可提供一整套移动解决方案,满足最终用户的多种要求,包括在保持系统性能
的前提下运行工程设计应用,为多功能娱乐设备提供图形处理能力等等。
伴随GeForce™Go
移动图形处理器家族(包括性能超群的GeForceFXGo系列)的推出,NVIDIA成为业界首家
提供适用于移动市场的高性能三维图形处理器的企业。
对工程师和动画师而言,全球第一款
移动工作站图形芯片QuadroGoGL能够让他们在移动平台上实现实时交互。
立足于大获成
功的媒体和通信处理技术,NVIDIAnForce3GOMCP集成了能够扩充笔记本功能和实现极致
数字媒体PC体验的软硬件技术。
手持终端
NVIDIAGoForce媒体处理器产品线能够让手持终端OEM打造极富诱惑力的产品。
NVIDIA
GoForce节能型图形芯片能够在极低的功耗下高效处理图形和视频内容,为手持终端设计者
提供了一种激动人心的产品,能够让他们为配装数码相机的手机和其他手持终端开发高分辨
率图片采集、视频采集、视频播放、游戏和彩信应用。
NVIDIA的GoForce产品家族能够在软
件上兼容MediaQ公司早期推出的媒体处理器,因此,拥有基于MediaQ的产品设计的OEM
能够快速升级产品,支持新的应用。
借助基于硬件的多媒体处理技术,NVIDIAGoForce能够
实现业内领先的性能和超炫视觉效果。
消费类电子产品
微软XboxTM视频游戏控制台借助NVIDIAXbox图形处理器(XGPU)以及Xbox媒体和
通信处理器(MCPX)实现出色的图形效果和令人难以置信的音频效果,以及最富动感的游
戏体验。
除此以外,NVIDIA的XGPU和MCPX还能实现超凡脱俗的三维图形、DVD和高清晰
度电视、三维环境音效以及宽带连接功能。
3行业地位与竞争对手
曾经最大的竞争对手是ATI(ArrayTechnologyIndustry)。
ATI是世界著名的显示芯片生产
商,和NVIDIA齐名,中文名叫“冶天”。
在1985年至2006年之间是全球重要的显示芯片
公司,总部设在加拿大安大略省,现已被美国AMD公司收购后成为该公司的一部份。
ATI
在美洲、欧洲和亚洲等地曾拥有超过3,700名员工,营业额为22亿美元,是一家专门设计
与销售适用于个人电脑的显示卡、图形处理器、芯片组、机顶盒、数字电视、电子游戏机和
手提式设备等的无厂半导体公司(由于芯片生产线投资昂贵,半导体行业通常分为“有厂”
和“无厂”两类。
有工厂半导体企业是哪些不但可以设计芯片,也能在自家工厂自行生产的,
而无工厂半导体企业则是那些专职从事芯片设计和销售、然后将设计交付新加坡特许半导
体、台湾台积电、台湾联电等这样的专业芯片合约制造厂进行生产)。
NVIDIA面临最重要的挑战毫无疑问就是来自于Intel和AMD了。
特别是进来Intel对于
竞争对手的打压行动相当活跃,拿着专利权的“必杀武器”与NVIDIA和AMD同时打官司。
对NVIDIA更是提出终止专利授权的要求,虽说目前的官司输赢还没有定案,但是Intel与
NVIDIA关系毫无疑问将会受到较大的损害,最坏的情况将是NVIDIA在未来一到两年内无法
生产基于IntelCPU平台的主板芯片。
而AMD的把CPU与GPU融合的Fusion更是让专注于
GPU的NVIDIA相当尴尬。
与AMD和Intel等竞争对手不同,NVIDIA并没有自己的工厂。
NVIDIA是专注于技术研
发的企业,其产品基本上都是由全球各地的代工厂进行代工,而中国台湾则是其主要的生产
基地。
然而亚洲地区对于知识产权的保护,不同的地区有不同的法律,对于NVIDIA这种靠
知识产权吃饭的企业带来了很多潜在的隐忧。
4主流Nvidia图形核心%
从win7开始,微软推出了Directx11,视觉效果进入了一个全新的领域,从Win7那华丽的效果,我们就已经无法抗拒的抛弃的directx9,AMD公司在这个关键的时刻抓住了时机,迅速推出了ATI5000系列显卡,并快速抢占了directx11市场,在这一点上nvidia公司确实慢了一步,还好亡羊补牢为时未晚,在其后nvidia公司也推出了它的Drectx11的核心
4.1GF100
一、GF100游戏架构的两颗新心脏
我们已经知道,GF100采用台积电40nm工艺制造,集成大约30亿个晶体管,包含512个流处理器(SP),或者按照NVIDIA官方的说法是CUDA核心。
32个这种核心组成一个流式多处理器阵列(SM),然后再四个组成一个图形处理集群(GPC)。
GF100就是这样的三层分级架构:
4个GPC、16个SM、512个SP。
NVIDIA声称FermiGF100是一个全新架构并非没有道理。
不但是通用计算方面,游戏方面它也发生了翻天覆地的变化,几乎每一个原有模块都进行了重组:
有的砍掉了,有的转移了,有的增强了,还有新增的光栅引擎(RasterEngine)和多形体引擎(PolyMorphEngine)。
光栅引擎严格来说光栅引擎并非全新硬件,只是此前所有光栅化处理硬件单元的组合,以流水线的方式执行边缘/三角形设定(Edge/TriangleSetup)、光栅化(Rasterization)、Z轴压缩(Z-Culling)等操作,每个时钟循环周期处理8个像素。
GF100有四个光栅引擎,每组GPC分配一个,整个核心每周期可处理32个像素。
多形体引擎则要负责顶点拾取(VertexFetch)、细分曲面(Tessellation)、视口转换(ViewportTransform)、属性设定(AttributeSetup)、流输出(StreamOutput)等五个方面的处理工作,DX11中最大的变化之一细分曲面单元(Tessellator)就在这里。
GF100中有16个多形体引擎,每组SM一个,亦即每组GPC四个。
多形体引擎绝非几何单元改头换面、增强15倍而已,它融合了之前的固定功能硬件单元,使之成为一个有机整体。
虽然每一个多形体引擎都是简单的顺序设计,但16个作为一体就能像CPU那样进行乱序执行(OoO)了,也就是趋向于并行处理。
NVIDIA还特地为这些多形体引擎设置了一个专用通信通道,让它们在任务处理中维持整体性。
当然,这种变化复杂得要命,也消耗了NVIDIA工程师无数的精力、资源和时间。
事实上可以这么说,多形体引擎正是GF100核心最大的变化所在,也是它无法在去年及时发布的最大原因。
NVIDIA产品营销副总裁UjeshDesai说过这么一句话:
设计这么大的GPU实在是太TMD难了。
其实,他指的并不是30亿个晶体管。
这么做也是不得已而为之。
考虑到细分曲面单元的几何复杂性,固定功能流水线已经不适用,整个流水线都需要重新平衡。
通过多形体引擎的并行设计,几何硬件不再受任何固定单元流水线的局限,可以根据芯片尺寸弹性伸缩。
和之前的GT200/G92以及AMD相比,GF100走上了另一条路,而且颇有要做CPU的架势。
在每一组SM阵列里,纹理单元、一二级缓存、ROP单元和各个单元的频率也都完全不同于以往。
每组SM里四个纹理单元,合伙使用12KB一级纹理缓存,并和整个芯片共享768KB二级缓存。
每个纹理单元每周期可计算一个纹理寻址、拾取四个纹理采样,并支持DX11新的压缩纹理格式。
ROP单元总共48个,分为六组,分别搭配一个64-bit显存通道。
所有ROP单元和整个芯片共享768KB二级缓存(GT200里是独享)。
除了ROP单元和二级缓存,几乎其他所有单元的频率都和Shader频率(NVIDIA暂称之为GPC频率)关联在一起:
一级缓存和Sahder单元本身是全速,纹理单元、光栅引擎、多形体引擎则都是一半。
对于GF100来说,想超频的话很多地方都要重新来过了。
基于GF100核心的三款高端产品GeForceGTX480/470/465发布后,NVIDIA接下来的任务自然就是将Fermi新架构带入更大规模的主流和低端市场。
首先是“GF104”,GF100核心的精简衍生版而非直接屏蔽得来,也被不少人称为Fermi2。
基于该核心的显卡型号为GeForceGTX460,该卡将在七月中旬正式发布,定价230美元左右,基本相当于RadeonHD5830,至于性能上不会有太大优势。
第二个核心“GF106”,八月中旬登场,价格129-179美元,型号据称有两款“GeForceGTS455/450”,具体规格尚不清楚,竞争RadeonHD5700系列而取代GeForceGTS250——G92核心架构终于要退休了。
再往下是“GF108”,可能在八九月间推出,面向入门级市场,价格应该在100美元之下,取代目前主推的GeForceGT240,竞争对手自然就是RadeonHD5600/5500系列了。
5从nvidia看GPU发展之路
上周末国外IT网站Fudzilla对NVIDIA的总裁兼首席执行官黄仁勋进行了专访,对NVIDIA的未来的发展道路进行了探讨。
黄仁勋表示说:
“在未来显卡的应用将大幅增强,在日常应用中它不仅会负责图形图像的输出,它还会转化成一个协作处理器。
不可否认的是CPU仍然是一个计算机的重要组成部分,但因为运算方式的不同,CPU对串行数据能够进行良好的支持,而对于运算较为简单而且数据量大的并行数据就会显得力不从心。
GPU运算技术的出现很好的解决了这一问题,它可以有效的为CPU分担这些数据,让系统整体运算性能提高数倍。
”
“在GPU的帮助下,视频编码和解码将变得简单高效,对于科学设计领域它也可以发挥巨大的作用。
我们相信在不久之后CPU和GPU会像兄弟一样,在它们的协作下用户将得到更迅捷的使用体验。
”
当CPU遭遇GPU?
这在普通大众来说可能有点难以理解。
那么换个说法,“当轿车遭遇F1”,两车车速相比立分上下。
—轿车像CPU,在全世界的交通工具中占据绝对统治地位,技术成熟,安全平衡。
而F1像GPU,在汽车的关键性指标上表现突出:
极快的速度,但同时又有明显的局限性,需要专门的赛道等客观条件来实现。
那么,当CPU遭遇GPU时,倒底会发生什么?
这要追溯到1971年,世界上第一款CPU(中央处理器)诞生。
在CPU四十年的成长岁月里,不断升级换代,技术日益完善,其作为国内外服务器厂商广泛应用的“心脏”,占据着统治地位。
CPU和GPU,倒底孰优孰劣?
CPU是基于程序计算的平衡性设计,在操作系统、系统软件、应用程序、通用计算、系统控制等领域有着优良的表现;而GPU最早应用于显卡,在图形类矩阵运算以及非图形类并行数值计算,GPU的浮点运算上表现非常出众,并且在上述领域其速度远远优于CPU,就好像F1,在赛道上驰骋,可以发挥最大的功效。
近几年,随着GPU的发展,人们开始尝试使用GPU来完成某些计算任务,使得GPU的应用范围正逐渐扩大,开始对CPU的统治地位提出了挑战。
作为国内高性能计算领域领军企业的曙光,曙光推出了一系列集CPU和GPU优势于一体的产品。
曙光A620r-T能够为小规模GPU应用提供优质的硬件平台,而曙光GPHC1000将是大中型GPU应用的完美基础系统。
有曙光“杀手锏”之称的中国最新一代集CPU与GPU优势于一体的高性能服务器——曙光天阔A620r-T全新面世。
它是曙光与过程所精心打
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Nvidia GOU的使用 GOU 使用