首页 > 范文大全 > 正文

比G80还要强!

开篇:润墨网以专业的文秘视角,为您筛选了一篇比G80还要强!范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

对于硬件发烧友和游戏玩家来说,近期DirectX10无疑是受关注的焦点。NVIDIA GeForce 8800系列显卡(代号g80)让大家领略到了新一代DirectX10显卡的强悍性能,随之而来的期待是,传说中比G80更加强大的AMD R600又是什么样的呢?

如果不出意外的话,在这个月内,AMD(这里指原ATI公司,现被AMD收购,下文均称为AMD)将向位于加利福尼亚的宿敌NVIDIA发起新的挑战,因难产和收购案而倍受瞩目的新一代DirectX 10图形芯片R600即将问世。

一、R600规格初探

R600有可能会正式命名为Radeon X2800,初期将推出RadeonX2800 XTX和Radeon X2800 XT两个版本。Radeon 2800 XTX的核心/显存频率为750MHz/2.2GHz,使用16颗三星颗粒组成1GBGDDR4显存,显存位宽达到了512-bit。Radeon X2800 XT则是前者的简化版,核心/显存频率为600MHz/1.8GHz,采用512MBGDDR3显存,显存位宽仍为512-bit。

R600采用80nm制程,支持HDCP和HDMI,并为高清视频播放进行了优化,甚至有可能支持硬解压BD或者HD DVD。除了高端的R600图形芯片,AMD还将随后推出针对中端主流市场的RV630和针对低端市场的RV610,以完善其DirectX 10产品线。

二、AMD欲打翻身仗

是的,AMD现在的确太需要一场胜利来证明自己了。自从R300那场酣畅淋漓的胜利以来,AMD再也没有在高端市场拥有绝对的优势。相比NVIDIA“卧薪尝胆”而推出的NV4x图形芯片和高性能,低成本的G7x图形芯片,AMD的R4xx在架构设计上过于保守,以及R5xx的难产让AMD倍受打击。据LongbOW Research咨询公司在2006年9月的市场调查报告称,由于R5xx的难产,NVIDIA曾在2005年10月的高端市场中创造了90%以上占有率的惊人纪录。幸亏随后问世的Radcon X1000系列图形芯片帮助AMD挽回了市场,LongbowResearch表示,2006年前三个季度AMD在高端市场的占有率达到3l%左右,但总体上看仍处于劣势。

R580在大多数游戏中比G71最高端版本强不到20%,但两者的晶体管数量相差28%(3.84亿个vs.2.78亿个),核心面积的差异更是高达46%(358mm2vs.196mm2)!这意味着在同一块晶圆上,R580会少切割出30%左右的芯片,成本自然大大高于对手。AMD在后期推出80nm版本的RV570,总算将成本降了下来,但也只是亡羊补牢。这一时期的教训对于AMD来说是非常惨痛的。

为报一箭之仇,AMD将R5xx架构的精髓与Xenos(Xbox360的图形芯片)的统一着色架构结合起来作为R600架构的原型,这对AMD来说是最高效的做法。实际上,NVIDIA在这里成功地瞒过了AMD,让AMD误以为G80只不过是一款采用传统架构的图形芯片,不具备与R600正面竞争的能力。因此,面对G80这个“落后的NVIDIAT一代产品”,AMD选择何种架构来打造R600是显而易见的事了。

三、R600=R5XX+统一着色架构

其实,R600的架构论证和底层设计从2003年就已经开始。它最初的规划就是R5xx与Xenos的结合体,控制成本也被列入目标之一。由于AMD在R5xx和Xenos的设计和制造上都已经有了充分的积累,因此可以在R600的性能和成本之间找到一个很好的平衡点。从某种程度上来看,这也是为在市场上受挫的R5xx复仇的计划。

既然R5xx的市场表现不理想,为什么AMD还要基于它的架构来开发R600呢?实际上,R5xx的架构设计思路是非常优秀的,只是由于成本控制、产量和时间推迟等因素才导致叫好不叫座。但这无法掩盖R5xx架构本身所绽放的光芒,借鉴了NV4x的优秀之处,它在Shader Model 3.0多执行运算体系、可编程内存控制器、HDR+AA等方面无不是青出于蓝而胜于蓝。在经历了不成熟的R520之后,高端的R580终于帮助AMD重新夺回当时图形芯片的性能王座。另一方面,AMD在为Xbox360游戏机设stxenos图形芯片的过程中也获得了宝贵的经验。

基于Xenos的设计经验,加上AMD误以为G80只会采用传统着色架构,因此R600采用统一着色架构早就是板上钉钉的事了。从目前的消息来看,尽管R600和G80都采用了统一着色架构,但AMD和NVIDIA这次在架构的具体设计上并不相同。受上一代产品的影响,G80强调架构本身的潜力和通用计算能力,而R600侧重于3D图形处理。

1.矢量运算单元vs.标量运算单元

R600与G80最大的区别就是前者采用传统的矢量运算单元,而后者采用创新的标量运算单元,这也是业界和硬件发烧友们争论的焦点。

所谓标量(sealar)运算单元(ALU),是相对于早期图形芯片采用的矢量(vector)运算单元而言,我们知道,在3D图形处理中,像素是由RGB三种颜色构成,加上它们共有的信息说明(Alpha),一共是四个通道,顶点(Vertex)数据也一般是由x、y、z、w四个坐标构成,一共也是四个通道,处理3D图形其实就是改变R、G、B、A或x、Y、z、w四个通道的数值。在一个时钟周期内,运算单元进行一次这种变量操作,就被称做1D标量操作。为了一次性处理一个像素渲染或几何转换,大多数图形芯片的运算单元都被设计为一个时钟周期并行执行四次1D运算,即4D矢量运算单元。因此这种运算单元的指令发射端只有一个,但却可以同时运算四个通道的数据,这就是SIMD(单指令多数据流)。

对于图形渲染来说,这种SIMD的设计真是再好不过了,因为顶点着色器和像素着色器进行的大部分运算都是4D矢量操作。但是NVIDIA在G80上却采用了标量运算单元。对于传统的4D矢量操作,理论上它就要耗费更多的运算时间,为什么NVIDIA要这样做呢?这是因为运算指令并不总是4D的,也有很多1D、2D、3D等情况,一旦4D矢量运算单元收到了这类较短的指令,只会使用一部分运算能力来处理,另一部分运算能力则暂时闲置起来,造成浪费,而1D标量运算单元就不存在这个问题,理论上能保证100%的运算效率。因此G80采用的是1D MIMD(多指令多数据流)运算单元,然后通过增加运算单元的数量(128个统一着色器)、提高着色器的频率(1,35GHz)来 增加运算能力。看上去,G80的1D MIMD运算单元似乎更完美,但实际情况真是这样的吗?

凡是事物都有两面性,尽管1D MIMD运算单元的效率很高,但为了达到和4D SIMD运算单元同样的运算能力,就要增加运算单元的数量,这无疑需要更多的晶体管和更大的芯片面积,运算单元增加的同时,内部的信号延迟也会变大。因此AMD仍然在R600中采用了4DSIMD运算单元。

我们可以算一下,G80具备128个1DMIMD运算单元,理论上着色器指令的吞吐能力是1350MHz×128×3Flops=519GFlops(每秒的浮点运算次数);而R600有64个4D SIMD运算单元,理论上着色器指令的吞吐能力是800MHz×64×12Flops=615GFlops。纯粹的运算能力,R600有非常明显的优势。当然,针对不同类型的运算,两者的实际运算能力都有较大的出入,因此不能简单地论输赢。在3D图形处理方面,传统的4DSIMD运算单元无疑更加适合,从目前的消息来看,在部分图形测试中R600的性能甚至比G80高40%以上;而G80的1D MIMD运算单元设计则会在通用计算上领先,可以说是为了图形芯片的未来发展而设计,潜力巨大。

2.R600的显存带宽更大

除了4D SIMD运算单元更适合图形运算外,R600的另一个优势是采用了512-bit的显存位宽和内部1024-bit环状总线。从《Crysis》等次世代游戏上我们就可以发现,DirectX 10游戏的画面越来越逼近真实,实时运算量激增。面对今后越来越庞大的数据量,除了图形芯片本身的运算能力之外,图形芯片与显存之间的带宽也变得更加重要,否则运算能力再高也无用武之地。R600搭配了512-bit GDDR4显,显存位宽轻易超过140GB/s;而GeForce 8800 GTX的显存位宽只有384-bit,使得它的带宽还在86GB/s左右徘徊。毫无疑问,在高分辨率、全屏抗锯齿等方面R600将有明显优势。

四、R600要后发制人

在G80的当天,AMD确实被震撼了,眼前的G80与之前的谣言相去甚远,G80不但采用了统一着色架构,甚至还更进一步革新了运算单元,整个着色器部分的晶体管都采用了双速动态逻辑电路,着色器频率也不再与核心同步,最让人惊叹的是这个拥有6.8亿个晶体管的“怪兽”居然是用90nm制程实现的。

但AMD很快又回复到了平静,因为它发现,G80架构的劣势跟自己当年的R5xx如出一辙,都是由于架构体系彻底革新,以及受到工艺制程的影响导致成本过于高昂。而R600得到了AMD-IBM的先进半导体工艺技术的支持后,硬件潜力被进一步挖掘。R600在原ATI被收购前的A11版样卡中,要达到600MHz的核心频率都很困难,但最近的A12版样卡已经能轻易达到800MHz,传闻中随后的版本甚至能够在风冷散热的情况下超过1GHz的核心频率。这样一来,高频率带来的高运算能力,配合512-bit显存位宽带来的超高带宽,AMD将NV当年用7800GTX对付R520的招数如数奉还,用最短的时间准备好了一款G80杀手。

五、结语:为DireCtX 10游戏而生

可以看到,AMD汲取了以前R5xx的惨痛教训,在R600的设计上采取了更为稳妥的方法,兼顾性能与成本,让R600以仅仅5.8亿个晶体管就能达到甚至超过G80采用6.8亿个晶体管才具有的游戏性能。虽然G80的通用计算能力更强,但这在传统图形领域派不上用场;而R600无疑是一款为游戏而生、更适合普通大众的图形芯片。这也正印证了以前那句耳熟能详的广告词:“ATI get in the game”。