GPU发展史之 ATI巅峰时刻

dyhyc07p

浏览: 19914 次

最近访客更多访客>>

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

2012-01 ( 18)
更多存档...

博客分类：

技术杂绘

GPU发展史之 ATI巅峰时刻
2010年12月16日
　　

　　
　　图注：NVIDIA公司的创始人黄仁勋先生和ATI公司的创始人何国源先生
　　[b]    1963年，黄仁勋出生于中国台北。1983年，黄仁勋大学毕业后毫不犹豫地搬到硅谷，并应聘AMD公司，成为一名芯片设计工程师，两年后跳槽到偏向于图形处理的芯片商LSI Logic。在职期间苦读6年后成为斯坦福电子工程硕士。1993年1月，NVIDIA正式成立，作为创始人之一的他担任NVIDIA首席执行官。[b]    1950年，何国源出生在广东省新会地区。1974年，何国源大学毕业回到香港，在那里找到了他平生第一份正式工作。何国源的第一份工作是在“Control Data”电脑公司做部门主管。1983年，何国源决定去加拿大发展之前，年轻的他在王氏电子公司已经做到了总经理。1985年，何国源和另外两名香港移民Benny Lau（产品开发副总裁）和Lee Lau（策略计划副总裁）共同创建的ATI（Array Technology Inc）。公司在多伦多北部的万锦市宣告成立。    2001年2月，NVIDIA终于发布了具有划时代意义的GeForce 3。Geforce 3采用0.15微米工艺制程，在晶体管数量上多达5700万个，这个数据整整是RIVA 128显卡的8倍，已经超高当时最强的P4处理器4200万个。GeForce 3拥有4个Pixel Shader和1个Vertex Shader（顶点处理单元）。同时，NVIDIA为游戏开发者提供了完整的Geforce架构开发工具，允许游戏开发者编制他们自己的程序来控制像素的效果，给游戏和应用开发者带来了极大的方便。
　　●GeForce 3 Ti系列产品技术优势：★★★★ 市场优势：★★★★[b]    微软在2002年对DirectX 8.0进行升级诞生了DirectX 8.1，新标准对VS和PS的渲染加强，增加对大纹理水波纹的处理效果，新的DirectX 8.1使你获得更好的图像显示质量，使多人游戏更具可伸缩性，以及包括更优异的音频效果。ATI则利用这个机会，通过代号R200的Radeon 8500显卡首次超过了NVIDIA的GeForce 3。在当时，做工优秀、画面显示质量出色的Radeon 8500显卡成为业界公认性能最出色的显卡，一举超越了压制NVIDIA的Geforce 3 Ti系列显卡。
　　●Radeon 8500系列产品技术优势：★★★★★ 市场优势：★★★★[b]    代号R200的Radeon 8500的基本结构与当时的其他显卡差不多；它拥有四个像素单元，每个像素单元拥有两个纹理单元。它亦支持DirectX 8.1的顶点着色引擎和像素着色引擎，它的两个顶点着色引擎被称为Charisma Engine II，为新的顶点着色程序和旧的DirectX 7硬件T&L都提供出色的效能。Radeon 8500支持像素着色器版本1.4，相对1.x版本的设计，这个修订版本是意义重大的。鉴于PS1.2和1.3只是PS1.1的改进版， 8500拥有第一和唯一的ATI硬件加速细分曲面绘图引擎，名为“Truform”，这个引擎通过十年的艰难发展后，最终成为我们在HD5870显卡中看到的Tessellation引擎。[b]    但是回头看DirectX 8时代的GPU，我们发现无论是NVIDIA还是ATI，都没有推出一款低端产品，而巨大的低端市场正面临产品断档的危险。[b]    2001年，在高端产品Radeon 8500之前，ATI发布了Radeon 7000系列显卡，因为这一系列显卡已经是ATI的第七代产品了。Radeon 7000系列总共有两款芯片，高端的R100（7200）和低端的RV100（7000）都使用了0.18微米工艺制造，拥有三千万晶体管，支持DirectX 7。这种以RV代表低端产品的做法被沿用至今。
　　●Radeon 7500系列产品技术优势：★★★ 市场优势：★★★★★[b]    Radeon 7500是款特别的显卡，核心代号为RV200，因为它是与ATI下一代的8500（R200）一同发布的，但仅支持DirectX 7。客观的讲，作为DirectX7平台下的Radeon7500带给我们的是与GeForce2 TI同等的性能，而且它还具备其他的特点，比如超高的芯片运行频率及显存带宽、Hydra Vision双头显示、优秀的视频流回放与2D显示画面等，更重要的是它有一个吸引人的价格。[b]    总体来说，Radeon 7500等经典显卡为ATI打下了低端和中端市场，市场份额渐渐接近NVIDIA。Radeon 8500在此时也诞生了大量的衍生物，他们包括9000、9100、9200、9250等等，规格型号甚至令人眼花缭乱。
　　●GeForce4 Ti系列产品技术优势：★★★★ 市场优势：★★★☆[b]    面对竞争对手ATI的步步紧逼，GeForce4 Ti于2002年2月应运而生。GeForce4 Ti基于改良版本的TSMC 0.15微米工艺，采用了最新nfiniteFX II引擎，Vertex Shader增加至2个。在高工作频率下，使得GeForce4 Ti的处理能力有可能高于GeForce3将近三倍。而在全屏反锯齿方面，GeForce4 Ti采用新的Accuview AA技术，改善了取样方式并且优化了渲染的过程，可以进一步保证在高分辨率下的显示速度。显存带宽也一直是制约显卡性能的瓶颈，GeForce4 Ti为了摆脱瓶颈的限制，引入了LightSpeed Memory Architecture II（LMA II）光速显存构架II技术，它的原理就是优化渲染过程和压缩技术的采用。[b]    GeForce4 Ti的性能领先程度巨大让ATI根本无力翻身，同时它完整支持DirectX 8.1也让NVIDIA在GPU着色器规格上没有任何遗憾。聪明的NVIDIA顺势推出了GeForce4 Ti4600、TI4400、Ti4200以及GeForce4 MX，其中最受用户欢迎的就是GeForce4 Ti4200，这是NVIDIA首次尝试高端产品低成本化（只有频率区分，没有架构改动），结果大获成功，持续热卖至2004年。
　　●GeForce4 MX系列产品技术优势：★★★ 市场优势：★★★★★[b]    而面向低端用户的GeForce4 MX更是由于对手产品线的空缺，这款显卡采用的核心实际上是GeForce 2 Ti，而显存控制器和抗锯齿功能则属于GeForce 4 Ti系列，虽然只支持DirectX 7，但它迅速取代GeForce 2 MX，创造了当时最好销量，成为最受欢迎的产品。
　　
　　
　　[b]Radeon 9700开启DirectX 9.0时代，NVIDIA深陷泥潭    ●DirectX 9.0带给业界的震撼[b]    随后到来的DirectX 9.0时代，让Shader单元具备了更强劲的性能。2002年底微软发布的DirectX 9.0中，PS单元的渲染精度已达到浮点精度，传统的硬件T&L单元也被取消。全新的Vertex Shader（顶点着色引擎）编程将比以前复杂得多，新的Vertex Shader标准增加了流程控制和更多的常量，每个程序的着色指令增加到了1024条。 [b]    PS 2.0具备完全可编程的架构，能对纹理效果即时演算、动态纹理贴图，还不占用显存，理论上对材质贴图的分辨率的精度提高无限多；另外PS1.4只能支持28个硬件指令，同时操作6个材质，而PS2.0却可以支持160个硬件指令，同时操作16个材质数量，新的高精度浮点数据规格可以使用多重纹理贴图，
　　可操作的指令数可以任意长，电影级别的显示效果轻而易举的实现。
　　基于Shader Model 2.0的3D Mark 03第四项游戏测试Mother Nature，对Shader单元运算复杂度和材质大小提出非常严苛的要求，当时只有高端显卡才能流畅通过该测试。
　　[b]    VS 2.0通过增加Vertex程序的灵活性，显著的提高了老版本（DirectX 8）的VS性能，新的控制指令，可以用通用的程序代替以前专用的单独着色程序，效率提高许多倍；增加循环操作指令，减少工作时间，提高处理效率；扩展着色指令个数，从128个提升到256个。 [b]    最重要的一点改进是增加对浮点数据的处理功能，以前GPU只能对整数进行处理，改进后提高渲染精度，使最终处理的色彩格式达到电影级别。Shader Model 2.0时代突破了以前限制PC图形图象质量在数学上的精度障碍，它的每条渲染流水线都升级为128位浮点颜色，让游戏程序设计师们更容易更轻松的创造出更漂亮的效果。[b]    如果说DirectX 8中的Shader单元还是个简单尝试的话，DirectX 9中的Shader则成为了标准配置。除了版本升级到2.0外，DirectX 9中PS单元的渲染精度已达到浮点精度，硬件T&L单元也成为历史的产物被取消，在较低DirectX版本游戏运行时会使用VS单元模拟执行硬件T&L单元的功能。
　　●两家厂商的不同命运    从DirectX 9开始，PC显卡业界由三名大佬掌权，它们是微软、ATI和NVIVIA。其中，微软担任3D API软件发展商的角色，不断更新DirectX应用程序接口，其它两个显卡厂商则紧紧跟随，推出相应的硬件产品，它们都想在未来的DX 9市场中称霸，但却遇到了不同的待遇。
　　[b]    实际上现在理性回顾当时的场景，ATI抢先发布了代号R300的Radeon 9700，不过，它发布时的DX9未完善，微软则会在最终版中加入VS（Vertex Shader，顶点描影）2.0、PS（Pixel Shader，像素描影）3.0。NVIDIA为了支持更多特性而延迟了NV30的发布，可惜它始终未能支持完整的VS 3.0/PS 3.0特性。[b]    总之，ATI和NVIDIA都不可能实现真正的DX 9，这是由两个厂商一手造成的。ATI发布Radeon 9700时，选择了VS 2.0/PS 2.0，NVIDIA选择了VS 2.0/PS 3.0。ATI和NVIDIA的分歧严重影响了DX的发展，甚至连OpenGL 2.0也受到牵连，微软则想取得领导地位，一直采取拖沿策略，以便保持自己在3D API的优势，借以打击OpenGL。
　　●Radeon 9700系列产品技术优势：★★★★★ 市场优势：★★★★☆[b]    但是ATI选择的是产品的发布速度，它坚信战场上兵贵神速。所以在NVIDIA沉浸于GeForce4 Ti带来的全盛时，ATI于2002年7月发布了首款支持DirectX 9的GPU――Radeon 9700。首款DX9图形芯片，256Bit的显存位宽，9700凭借8条管线理所当然的坐上了3D之王的宝座。[b]    由Radeon 9700衍生出的中端产品也吸引了消费者的眼球。当年9500显卡上演的改造风波也被传为佳话，9500黄金版（4管线可改8管线，128MB 256Bit显存；普通9500为4管线可改8管，64MB 128Bit显存）的知名度甚至要盖过9700。    直到年末，准确地说是在2002年11月18日，Comdex 2002上，NVIDIA发布了研发代号NV30的GeForce FX，“FX”代表NVIDIA收购3DFX之后的首款作品。这款产品拥有当时最大的功耗，最夸张的散热器设计，多项半导体行业领先技术，却因为一些细节方面导致了GeForce FX的全盘皆输。
　　[b]    种种迹象都表明，GeForce FX 5800 Ultra是一款失败的产品，12层PCB以及GDDR2显存带来的高额成本，以及高噪音高功耗的表现使得GeForce FX 5800 Ultra在于ATI Radeon 9700 Pro的竞争中败下阵来，受到自身4x2流水线架构以及性能低下的Shader执行效率限制，导致3D性能上GeForce FX 5800 Ultra也得不到半点好处。为了弥补高端市场上的失策，NVIDIA针对主流市场以及低端市场积极的推出了NV30的精简版本NV31、NV34，即GeForce FX5600以及FX5200，可惜架构仍然继承了NV30的高频低能。
　　由于晶体管数达到创纪录的1.25亿个，惊人的500MHz默认频率，致使NVIDIA不得不为GeForce FX 5800 Ultra搭配“FX Flow”的散热系统，它包含一个铜制散热片、热管和换气装置。[b]    ●GeForce FX5800系列产品技术优势：★★★ 市场优势：★★★[b]    Radeon 9700成为了ATI最成功的一代显卡，而NVIDIA随后推出Geforce FX系列则是NV最受争议的一代显卡。无论高中低端，R300架构造就的ATI显卡在竞争中都取得明显的优势。但R300架构也拥有明显的不足。R300芯片本身是32位和24位混合型的，内核像素描影器是FP24，而纹理寻址操作和顶点描影管道是FP 32。R300在像素描影管道中有24位内部浮点精度，而代号NV30的Geforce FX系列支持IEEE-32（S23e8）浮点精度，比DX9更精确。[b]    但R300的市场把握水平要明显强于NV30，最后带来了ATI的胜利。这一优势持续了两年多，市场份额资料称，2004年ATI占了全球独立图形芯片出货量的一半儿还多。ATI终于成为第一大独立图形芯片厂商，成功超越了NVIDIA。[b]    Radeon 9700的先进架构造就了它的高效率。在普遍\情况下，它能比昔日的王者GeForce4 Ti 4600快大约15-20%。但是，当运行抗锯齿（AA）和各异向性过滤（AF）计算时，它能比Ti 4600快大约40-100%。在当时来说，这种性能提升出乎所有用户意料，R300使到人们广泛接受AA和AF，使之成为必不可少的功能。R300也因为众多优秀之处成为历史上最长寿的显示芯片，R300推出3年后，还能为新游戏够提供合理的性能。总而言之DirectX 9.0时代的最初故事就是这样充满火药味和戏剧性。
　　●FX 5900亡羊补牢，Radeon 9800依然坚挺[b]    经历了GeForce FX 5800的惨痛教训之后，NVIDIA开始着手做两件事。首先是对NV30架构进行改进代号NV35，以图挽回市场份额，重新夺取性能宝座；另一方面则加速NV40芯片设计，这将是NVIDIA在未来上演的重头戏。[b]    半年后，也就是2003年5月份，NVIDIA发布了NV35核心的GeForce FX 5900，与GeForce FX 5800Ultra相比，GeForce FX 5900采用了更加成熟的0.13微米工艺，晶体管数量虽然增加了500万个晶体管，不过借助成熟的0.13微米工艺，芯片良率以及发热量都有了改善。
　　●GeForce FX5900系列产品技术优势：★★★☆ 市场优势：★★★☆[b]    图像技术方面这款产品也拥有众多亮点，新的NV35采用了备受业界好评的CineFX2.0引擎（增加了UltraShadow光影技术以及Intellisample HTC技术）。其中Intellisample HTC（高分辨率压缩技术），能有效改善全屏抗锯齿以及各向异性过滤的效果。[b]    新的NV35采用了CineFX2.0引擎，和第1代CineFX相比，NVIDIA对Pixel Shader做出了一定的改进，在保留FX12 combiner的同时增加了两个可进行浮点运算的miniALU，虽然miniALU的功能有限，但是还是使得NV35的浮点运算能力提高了一倍。除此之外，最大的改变就是从128bit显存位宽升级到256bit显存位宽，搭配的850MHz DDR-I显存可以提供的带宽高达27.2GB/s，远远高于GeForce FX 5800Ultra的16GB/s。    不久后，NVIDIA又发布了NV36――GeForce FX 5700以及低频版的GeForce FX 5900XT显卡，在全部继承了NV35的基础上大幅缩减了产品的成本。尤其是GeForce FX 5900XT显卡，凭借准确的定位和较高的性价比，市场好评不断。
　　●Radeon 9800系列产品技术优势：★★★★ 市场优势：★★★☆[b]    ATI采用了同样的方法，并且没有重新设计架构，只是用更小的代价稍作改进推出了代号R350的Radeon 9800。虽然9800在架构上并没有太多的改进，制造工艺依然维持0.15微米（之后高频的9800XT还是0.15微米），但频率的提高让它的性能比9700更上一层楼，SmartShader2.1和SmoothVision 2.1可能就是为数不多的改进了。在此基础之上的巅峰之作9800XT显卡更是把频率提升到了极限。[b]    2004年4月，ATI在控制高端市场的基础上，为我们带来了一款意想不到的中端经典显卡――Radeon 9550，这款芯片的成功至今让ATI自己都无法复制。Radeon 9550依然基于RV350制造，在所支持特效方面也完全与该系列最高端的Radeon 9600XT相同。
　　●Radeon 9550系列产品技术优势：★★★ 市场优势：★★★★★[b]    4条管线和Radeon 9800级别的DX9规格保证了Radeon 9550强大的实力，它与Radeon 9600XT的差别仅仅在于频率，这使得各种非公版、超频版9550立刻席卷中低端市场，掀起了一股超频之风，当然成本下降带来的合理的定价，是Radeon 9550成为一代经典最主要的因素。9550发布之时ATI并没有对其所搭配显存做太多限制，同时RV350核心出色的超频能力更赋予了Radeon 9550强大的生命力。灵活的规格和优秀的性价比使它成为ATI低端显卡中销量最高的型号。
[/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b]

分享到：

Autodesk 3ds Max 2011中文版下载 | 浅描工作环境电脑维护以及性能测试流程

2012-01-19 16:54
浏览 527
评论(0)
分类:非技术
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论