`
dyhyc07p
  • 浏览: 19914 次
最近访客 更多访客>>
社区版块
存档分类
最新评论

GPU发展史之 ATI巅峰时刻

 
阅读更多

GPU发展史之 ATI巅峰时刻
2010年12月16日
  

  
  图注:NVIDIA公司的创始人黄仁勋先生和ATI公司的创始人何国源先生
  [b]    1963年,黄仁勋出生于中国台北。1983年,黄仁勋大学毕业后毫不犹豫地搬到硅谷,并应聘AMD公司,成为一名芯片设计工程师,两年后跳槽到偏向于图形处理的芯片商LSI Logic。在职期间苦读6年后成为斯坦福电子工程硕士。1993年1月,NVIDIA正式成立,作为创始人之一的他担任NVIDIA首席执行官。[b]    1950年,何国源出生在广东省新会地区。1974年,何国源大学毕业回到香港,在那里找到了他平生第一份正式工作。何国源的第一份工作是在“Control Data”电脑公司做部门主管。1983年,何国源决定去加拿大发展之前,年轻的他在王氏电子公司已经做到了总经理。1985年,何国源和另外两名香港移民Benny Lau(产品开发副总裁)和Lee Lau(策略计划副总裁)共同创建的ATI(Array Technology Inc)。公司在多伦多北部的万锦市宣告成立。    2001年2月,NVIDIA终于发布了具有划时代意义的GeForce 3。Geforce 3采用0.15微米工艺制程,在晶体管数量上多达5700万个,这个数据整整是RIVA 128显卡的8倍,已经超高当时最强的P4处理器4200万个。GeForce 3拥有4个Pixel Shader和1个Vertex Shader(顶点处理单元)。同时,NVIDIA为游戏开发者提供了完整的Geforce架构开发工具,允许游戏开发者编制他们自己的程序来控制像素的效果,给游戏和应用开发者带来了极大的方便。
  ●GeForce 3 Ti系列产品 技术优势:★★★★ 市场优势:★★★★[b]    微软在2002年对DirectX 8.0进行升级诞生了DirectX 8.1,新标准对VS和PS的渲染加强,增加对大纹理水波纹的处理效果,新的DirectX 8.1使你获得更好的图像显示质量,使多人游戏更具可伸缩性,以及包括更优异的音频效果。ATI则利用这个机会,通过代号R200的Radeon 8500显卡首次超过了NVIDIA的GeForce 3。在当时,做工优秀、画面显示质量出色的Radeon 8500显卡成为业界公认性能最出色的显卡,一举超越了压制NVIDIA的Geforce 3 Ti系列显卡。
  ●Radeon 8500系列产品 技术优势:★★★★★ 市场优势:★★★★[b]    代号R200的Radeon 8500的基本结构与当时的其他显卡差不多;它拥有四个像素单元,每个像素单元拥有两个纹理单元。它亦支持DirectX 8.1的顶点着色引擎和像素着色引擎,它的两个顶点着色引擎被称为Charisma Engine II,为新的顶点着色程序和旧的DirectX 7硬件T&L都提供出色的效能。Radeon 8500支持像素着色器版本1.4,相对1.x版本的设计,这个修订版本是意义重大的。鉴于PS1.2和1.3只是PS1.1的改进版, 8500拥有第一和唯一的ATI硬件加速细分曲面绘图引擎,名为“Truform”,这个引擎通过十年的艰难发展后,最终成为我们在HD5870显卡中看到的Tessellation引擎。[b]    但是回头看DirectX 8时代的GPU,我们发现无论是NVIDIA还是ATI,都没有推出一款低端产品,而巨大的低端市场正面临产品断档的危险。[b]    2001年,在高端产品Radeon 8500之前,ATI发布了Radeon 7000系列显卡,因为这一系列显卡已经是ATI的第七代产品了。Radeon 7000系列总共有两款芯片,高端的R100(7200)和低端的RV100(7000)都使用了0.18微米工艺制造,拥有三千万晶体管,支持DirectX 7。这种以RV代表低端产品的做法被沿用至今。
  ●Radeon 7500系列产品 技术优势:★★★ 市场优势:★★★★★[b]    Radeon 7500是款特别的显卡,核心代号为RV200,因为它是与ATI下一代的8500(R200)一同发布的,但仅支持DirectX 7。客观的讲,作为DirectX7平台下的Radeon7500带给我们的是与GeForce2 TI同等的性能,而且它还具备其他的特点,比如超高的芯片运行频率及显存带宽、Hydra Vision双头显示、优秀的视频流回放与2D显示画面等,更重要的是它有一个吸引人的价格。[b]    总体来说,Radeon 7500等经典显卡为ATI打下了低端和中端市场,市场份额渐渐接近NVIDIA。Radeon 8500在此时也诞生了大量的衍生物,他们包括9000、9100、9200、9250等等,规格型号甚至令人眼花缭乱。
  ●GeForce4 Ti系列产品 技术优势:★★★★ 市场优势:★★★☆[b]    面对竞争对手ATI的步步紧逼,GeForce4 Ti于2002年2月应运而生。GeForce4 Ti基于改良版本的TSMC 0.15微米工艺,采用了最新nfiniteFX II引擎,Vertex Shader增加至2个。在高工作频率下,使得GeForce4 Ti的处理能力有可能高于GeForce3将近三倍。而在全屏反锯齿方面,GeForce4 Ti采用新的Accuview AA技术,改善了取样方式并且优化了渲染的过程,可以进一步保证在高分辨率下的显示速度。显存带宽也一直是制约显卡性能的瓶颈,GeForce4 Ti为了摆脱瓶颈的限制,引入了LightSpeed Memory Architecture II(LMA II)光速显存构架II技术,它的原理就是优化渲染过程和压缩技术的采用。[b]    GeForce4 Ti的性能领先程度巨大让ATI根本无力翻身,同时它完整支持DirectX 8.1也让NVIDIA在GPU着色器规格上没有任何遗憾。聪明的NVIDIA顺势推出了GeForce4 Ti4600、TI4400、Ti4200以及GeForce4 MX,其中最受用户欢迎的就是GeForce4 Ti4200,这是NVIDIA首次尝试高端产品低成本化(只有频率区分,没有架构改动),结果大获成功,持续热卖至2004年。
  ●GeForce4 MX系列产品 技术优势:★★★ 市场优势:★★★★★[b]    而面向低端用户的GeForce4 MX更是由于对手产品线的空缺,这款显卡采用的核心实际上是GeForce 2 Ti,而显存控制器和抗锯齿功能则属于GeForce 4 Ti系列,虽然只支持DirectX 7,但它迅速取代GeForce 2 MX,创造了当时最好销量,成为最受欢迎的产品。
  
  
  [b]Radeon 9700开启DirectX 9.0时代,NVIDIA深陷泥潭
    ●DirectX 9.0带给业界的震撼[b]    随后到来的DirectX 9.0时代,让Shader单元具备了更强劲的性能。2002年底微软发布的DirectX 9.0中,PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元也被取消。全新的Vertex Shader(顶点着色引擎)编程将比以前复杂得多,新的Vertex Shader标准增加了流程控制和更多的常量,每个程序的着色指令增加到了1024条。 [b]    PS 2.0具备完全可编程的架构,能对纹理效果即时演算、动态纹理贴图,还不占用显存,理论上对材质贴图的分辨率的精度提高无限多;另外PS1.4只能支持28个硬件指令,同时操作6个材质,而PS2.0却可以支持160个硬件指令,同时操作16个材质数量,新的高精度浮点数据规格可以使用多重纹理贴图,
  可操作的指令数可以任意长,电影级别的显示效果轻而易举的实现。
  基于Shader Model 2.0的3D Mark 03第四项游戏测试Mother Nature,对Shader单元运算复杂度和材质大小提出非常严苛的要求,当时只有高端显卡才能流畅通过该测试。
  [b]    VS 2.0通过增加Vertex程序的灵活性,显著的提高了老版本(DirectX 8)的VS性能,新的控制指令,可以用通用的程序代替以前专用的单独着色程序,效率提高许多倍;增加循环操作指令,减少工作时间,提高处理效率;扩展着色指令个数,从128个提升到256个。 [b]    最重要的一点改进是增加对浮点数据的处理功能,以前GPU只能对整数进行处理,改进后提高渲染精度,使最终处理的色彩格式达到电影级别。Shader Model 2.0时代突破了以前限制PC图形图象质量在数学上的精度障碍,它的每条渲染流水线都升级为128位浮点颜色,让游戏程序设计师们更容易更轻松的创造出更漂亮的效果。[b]    如果说DirectX 8中的Shader单元还是个简单尝试的话,DirectX 9中的Shader则成为了标准配置。除了版本升级到2.0外,DirectX 9中PS单元的渲染精度已达到浮点精度,硬件T&L单元也成为历史的产物被取消,在较低DirectX版本游戏运行时会使用VS单元模拟执行硬件T&L单元的功能。
  ●两家厂商的不同命运    从DirectX 9开始,PC显卡业界由三名大佬掌权,它们是微软、ATI和NVIVIA。其中,微软担任3D API软件发展商的角色,不断更新DirectX应用程序接口,其它两个显卡厂商则紧紧跟随,推出相应的硬件产品,它们都想在未来的DX 9市场中称霸,但却遇到了不同的待遇。
  [b]    实际上现在理性回顾当时的场景,ATI抢先发布了代号R300的Radeon 9700,不过,它发布时的DX9未完善,微软则会在最终版中加入VS(Vertex Shader,顶点描影)2.0、PS(Pixel Shader,像素描影)3.0。NVIDIA为了支持更多特性而延迟了NV30的发布,可惜它始终未能支持完整的VS 3.0/PS 3.0特性。[b]    总之,ATI和NVIDIA都不可能实现真正的DX 9,这是由两个厂商一手造成的。ATI发布Radeon 9700时,选择了VS 2.0/PS 2.0,NVIDIA选择了VS 2.0/PS 3.0。ATI和NVIDIA的分歧严重影响了DX的发展,甚至连OpenGL 2.0也受到牵连,微软则想取得领导地位,一直采取拖沿策略,以便保持自己在3D API的优势,借以打击OpenGL。
  ●Radeon 9700系列产品 技术优势:★★★★★ 市场优势:★★★★☆[b]    但是ATI选择的是产品的发布速度,它坚信战场上兵贵神速。所以在NVIDIA沉浸于GeForce4 Ti带来的全盛时,ATI于2002年7月发布了首款支持DirectX 9的GPU――Radeon 9700。首款DX9图形芯片,256Bit的显存位宽,9700凭借8条管线理所当然的坐上了3D之王的宝座。[b]    由Radeon 9700衍生出的中端产品也吸引了消费者的眼球。当年9500显卡上演的改造风波也被传为佳话,9500黄金版(4管线可改8管线,128MB 256Bit显存;普通9500为4管线可改8管,64MB 128Bit显存)的知名度甚至要盖过9700。    直到年末,准确地说是在2002年11月18日,Comdex 2002上,NVIDIA发布了研发代号NV30的GeForce FX,“FX”代表NVIDIA收购3DFX之后的首款作品。这款产品拥有当时最大的功耗,最夸张的散热器设计,多项半导体行业领先技术,却因为一些细节方面导致了GeForce FX的全盘皆输。
  [b]    种种迹象都表明,GeForce FX 5800 Ultra是一款失败的产品,12层PCB以及GDDR2显存带来的高额成本,以及高噪音高功耗的表现使得GeForce FX 5800 Ultra在于ATI Radeon 9700 Pro的竞争中败下阵来,受到自身4x2流水线架构以及性能低下的Shader执行效率限制,导致3D性能上GeForce FX 5800 Ultra也得不到半点好处。为了弥补高端市场上的失策,NVIDIA针对主流市场以及低端市场积极的推出了NV30的精简版本NV31、NV34,即GeForce FX5600以及FX5200,可惜架构仍然继承了NV30的高频低能。
  由于晶体管数达到创纪录的1.25亿个,惊人的500MHz默认频率,致使NVIDIA不得不为GeForce FX 5800 Ultra搭配“FX Flow”的散热系统,它包含一个铜制散热片、热管和换气装置。[b]    ●GeForce FX5800系列产品 技术优势:★★★ 市场优势:★★★[b]    Radeon 9700成为了ATI最成功的一代显卡,而NVIDIA随后推出Geforce FX系列则是NV最受争议的一代显卡。无论高中低端,R300架构造就的ATI显卡在竞争中都取得明显的优势。但R300架构也拥有明显的不足。R300芯片本身是32位和24位混合型的,内核像素描影器是FP24,而纹理寻址操作和顶点描影管道是FP 32。R300在像素描影管道中有24位内部浮点精度,而代号NV30的Geforce FX系列支持IEEE-32(S23e8)浮点精度,比DX9更精确。[b]    但R300的市场把握水平要明显强于NV30,最后带来了ATI的胜利。这一优势持续了两年多,市场份额资料称,2004年ATI占了全球独立图形芯片出货量的一半儿还多。ATI终于成为第一大独立图形芯片厂商,成功超越了NVIDIA。[b]    Radeon 9700的先进架构造就了它的高效率。在普遍\情况下,它能比昔日的王者GeForce4 Ti 4600快大约15-20%。但是,当运行抗锯齿(AA)和各异向性过滤(AF)计算时,它能比Ti 4600快大约40-100%。在当时来说,这种性能提升出乎所有用户意料,R300使到人们广泛接受AA和AF,使之成为必不可少的功能。R300也因为众多优秀之处成为历史上最长寿的显示芯片,R300推出3年后,还能为新游戏够提供合理的性能。总而言之DirectX 9.0时代的最初故事就是这样充满火药味和戏剧性。
  ●FX 5900亡羊补牢,Radeon 9800依然坚挺[b]    经历了GeForce FX 5800的惨痛教训之后,NVIDIA开始着手做两件事。首先是对NV30架构进行改进代号NV35,以图挽回市场份额,重新夺取性能宝座;另一方面则加速NV40芯片设计,这将是NVIDIA在未来上演的重头戏。[b]    半年后,也就是2003年5月份,NVIDIA发布了NV35核心的GeForce FX 5900,与GeForce FX 5800Ultra相比,GeForce FX 5900采用了更加成熟的0.13微米工艺,晶体管数量虽然增加了500万个晶体管,不过借助成熟的0.13微米工艺,芯片良率以及发热量都有了改善。
  ●GeForce FX5900系列产品 技术优势:★★★☆ 市场优势:★★★☆[b]    图像技术方面这款产品也拥有众多亮点,新的NV35采用了备受业界好评的CineFX2.0引擎(增加了UltraShadow光影技术以及Intellisample HTC技术)。其中Intellisample HTC(高分辨率压缩技术),能有效改善全屏抗锯齿以及各向异性过滤的效果。[b]    新的NV35采用了CineFX2.0引擎,和第1代CineFX相比,NVIDIA对Pixel Shader做出了一定的改进,在保留FX12 combiner的同时增加了两个可进行浮点运算的miniALU,虽然miniALU的功能有限,但是还是使得NV35的浮点运算能力提高了一倍。除此之外,最大的改变就是从128bit显存位宽升级到256bit显存位宽,搭配的850MHz DDR-I显存可以提供的带宽高达27.2GB/s,远远高于GeForce FX 5800Ultra的16GB/s。    不久后,NVIDIA又发布了NV36――GeForce FX 5700以及低频版的GeForce FX 5900XT显卡,在全部继承了NV35的基础上大幅缩减了产品的成本。尤其是GeForce FX 5900XT显卡,凭借准确的定位和较高的性价比,市场好评不断。
  ●Radeon 9800系列产品 技术优势:★★★★ 市场优势:★★★☆[b]    ATI采用了同样的方法,并且没有重新设计架构,只是用更小的代价稍作改进推出了代号R350的Radeon 9800。虽然9800在架构上并没有太多的改进,制造工艺依然维持0.15微米(之后高频的9800XT还是0.15微米),但频率的提高让它的性能比9700更上一层楼,SmartShader2.1和SmoothVision 2.1可能就是为数不多的改进了。在此基础之上的巅峰之作9800XT显卡更是把频率提升到了极限。[b]    2004年4月,ATI在控制高端市场的基础上,为我们带来了一款意想不到的中端经典显卡――Radeon 9550,这款芯片的成功至今让ATI自己都无法复制。Radeon 9550依然基于RV350制造,在所支持特效方面也完全与该系列最高端的Radeon 9600XT相同。
  ●Radeon 9550系列产品 技术优势:★★★ 市场优势:★★★★★[b]    4条管线和Radeon 9800级别的DX9规格保证了Radeon 9550强大的实力,它与Radeon 9600XT的差别仅仅在于频率,这使得各种非公版、超频版9550立刻席卷中低端市场,掀起了一股超频之风,当然成本下降带来的合理的定价,是Radeon 9550成为一代经典最主要的因素。9550发布之时ATI并没有对其所搭配显存做太多限制,同时RV350核心出色的超频能力更赋予了Radeon 9550强大的生命力。灵活的规格和优秀的性价比使它成为ATI低端显卡中销量最高的型号。
[/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b][/b]
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics