首页 > 范文大全 > 正文

跌落凡间的火种!

开篇:润墨网以专业的文秘视角,为您筛选了一篇跌落凡间的火种!范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

根据InteI的策略,2011年刚好到了lntel踏入钟摆战略的微架构升级期,(产品研发代号:sandyBridge文中简称sNB)clarksfield处理器首次把GPu加入到CPu封装里,而SNB则把融合技术更进一步。此次改变主要集中对处理器智能方面的优化,其中包括智能加速、电源管理、内置核显等。

SNB主要采用了全新图形处理技术,并对高清视频、图片处理、3D加速、多任务处理、多媒体等应用做出优化。sNB所有型号均内置了新一代核芯显卡,同时还配备了H.264解码器。在电源管理方面,芯片采用智能真体(笔者译)实现高效管理,下文我们一起探讨SNB的秘密。

SNB概览

SNB延续了Nehalem架构的优势,同时在前者的基础上做出了重大改进。借鉴了i系列产品线的深入民心,产品型号继续采用i7/i5/i3命名规则,定位上i7面向中高端人群,而i5主要给中端主流消费群体,i3则是入门级别的处理器。当然,上市的SNB并没提及发烧定位,所以发烧的消费用户还是由前一代产品Core i7 Extreme坐守,而取代i7六核的规格将由lvy Bridge完成。

SNB处理器包含了两条产品线,一是桌面系统,另一条是移动处理器。型号上,重点带K系列以及不带K的处理器,sNB新特征

新的SNB架构被命名为Visual smart,即“智能视觉”架构,从命名中可以看出处理器有两大核心改进,一是智能,二是视觉运算。在智能方面在,主要表现在SNB的Turb02.0技术,以及智能节能技术。在视觉领域上,SNB内嵌了专门的视频编解码电路,可以高效地实现H.264等编解码的运算。除此之外,SNB更加入了AVX高级向量指令,支持256位宽的操作,

SNB架构深入解析

CPU架构

SNB放弃了之前CPU核心与显示核心分离的设计,改用了处理器核心融合显示核心,在clarksfield的时期,两者是依靠QPl总线传输数据,同时效能上有所不足。而新的SNB架构则采用了共享3级缓存设计,可以大大加强异构核心之间的数据传输,同时CPU和GPU可以对等地操作数据,减少数据延时,这也为带K级别的CPU不锁倍频,面向超频玩家级用户,当然价格也会较高,而不带K的产品则锁定倍频,外频较难再往上攀升。此指令类似于sIMD指令,可以高性能实现向量操作以及数据密集型的运算。

本处理器的一大亮点是内置的显示核心以及CPU同样采用32nm工艺制成,漏电方面控制十分出色,保证了良好的功耗控制。在SNB系列的处理器中均具有核显,即高端到低端的型号也内置了显示核心。

SNB分为桌面级以及移动级产品线,内置的显示核心分为HD3000和HD2000两种,前者配备12个执行单元,后者具备6个执行单元。在移动处理器上,全部系列内~_HD3000核显,而且桌面级的处理器只有带K后续的型号才制成HD3000核显,其余均配置HD2000核心。笔记本的省电高效创造条件。

超标量超流水线:一般处理器都采用超流水线架构,也就是说把一个复杂的操作分为多个操作,然后运用指令集的并行来减少复杂操作的延时。而超标量也就是说明了处理器具备多个指令发射器,每次可以并行发射数条指令,从而增加指令吞吐量。SNB在超标量以及超流水线上都有了较多的改进,增加了指令执行的效率。

指令分支预测改进:在处理器的流水线上为了每个执行部件处于满载状态,必须有多个缓>中区,以便指令速度的同步。在缓冲区里面存储的是已翻译的指令,当指令没发生跳转的时候,会按照顺序相安无事地执行下去。但是,当遇上了跳转情况,便很难说了,如果跳转的深度超过了缓冲区的深度时,那么高速缓存的数据便要重新清空,因此之前编译指令的工作量就会全部白费,而且也会造成流水线的效率低下。

指令分支预测主要是预知那些即将转跳的指令,减少不必要的无用功。SNB中加入了不少的预测改进;其中有第二层分值预测缓存,这类似于当拾取到分值指令时,第二个目标缓>中区负责拾取可能跳转地址所在的指令。还有就是循环检测,这个类似for(a);语句中,如果a为真则继续跳转,当循环语句可观时这是个巨大的效能损失,因此需要检测循环来把它的逻辑取反来避免语句被)中掉。

加强的先行微指令缓冲区:指令缓冲区的作用在于把编译好的指令存放在高速的缓存上,这样可以增加指令重叠执行的概率,譬如拾取指令的同时,可以进行译码,并且同时进行指令的执行。当然,如果这三个步骤都对应同一个指令的时候,便是一种串行执行,效率十分低下。先行缓存区的目的就是这三个步骤异步执行,譬如有三条指令,当你执行第一条指令的时候,译码器同步地翻译第二条指令,而且执行拾取器在取地三条指令。

SNB处理器在指令队列后面增加了微指令缓存(uop缓存),作用就是上述所说的先行缓存。当指令经过一级高速缓存后,被预编译,这里可以把一些空指令等预先处理,然后就会被拾取到指令队列,队列后就被硬件编译成微指令。而SNB增加的Uop缓存正好在编译指令之后,用于存储已经便宜好的微指令。

Uop缓存采用直接映射的机制,即地址映射是一一对应,它能存储大约1.5K微指令,相当于6KB指令缓存。Uop存储的指令区别于一级指令缓存,L1存储的是未经编译的指令,而Uop存储的是已被编译处理好的指令代码,因此执行速度远高于L1,并且其指令的命中率都能达到80%左右,它的带宽也更高,速度几乎和物理寄存器相当。Uop缓存地位就相当于0级缓存,也就是在32KB一级数据缓存和32KB一级指令缓存后更加接近CPU内核的一层硬件,增加此设计可以大大加强CPU的指令速度,而且也有效减少因分支问题导致CPU流水线断层。

AVX高级向量指令:一般的标量指令,指的是单指令但数据流(sIsD)的意思,也就是说一条指令只能有一个操作数,但是随着多媒体等数据密集型的操作越来越广泛,CPU也渐渐增加了单指令多数据流,从开始的MMX(又名妈妈叉)指令,到烽火一时的SSE指令。

到了SNB架构上,Intel更增加了全新的向量指令AVX,其支持256bit操作数,适用于视频编解码工作,即使对像素的操作有较大的性能优势。AVX也就是SIMD指令,支持单指令多数据的操作,十分适合数据密集型的算法。

核显

SNB在内置显卡方面做出的改进十分大,其公布的性能提升为前代产品的两倍,即HD3000性能为Core i5 661的翻倍。规格上,SNB拥有两款核显,一个是HD3000,另一个是HD2000,前者内置12个核心,而后者拥有6个渲染单元,规格刚好相差一倍。频率设定上HD2000为850MHz睿频到1100MHz,2600K为可以睿频到1350MHz。

架构上,SNB的核显最大不同是采用了三级共享缓存的设计,其中核显和CPU内核共同通过环形总线去访问三级高速缓存,可以有效地提升效率。内核的环形总线架构类似于AMD早期在2900XTX时的环形访问总线,总线拥有四条独立的环组成,分别是数据环(DT)、请求环(QT)、响应环(RsP)、侦听环(sNP)。每条环的每个接入点在每个时钟周期内都能接收32字节数据,而且环的访问总会自动选择最短的路径,以缩短延迟。协议上采用环形总线的令牌协议,因此具备良好的系统扩展性。

测试平台

测试描述:本次测试采用第二代Core i7的最高规格处理器2600K,对比的处理器有Core i5-750以及AMD的高端6核处理器1090T。测试分为两个部分,一是处理器性能的测试,主要体验处理在运算能力,浮点、整数操作的速度。另外的测试是为了搭建一个平衡的3D游戏平台,采用高端显卡GTX580,同时游戏的测试设置为最高画质,虽然这样测试会让CPU的性能权重减少,但是此情况更加适用于我们日常应用的模拟。

多媒体性能   SNB的多媒体性能比前代产品又有质的提升,除了支持传统SSE多媒体指令外,SNB更新增了AVX指令,当软件支持此指令时效率会有翻倍的提高。另一方面,在视频处理上,SNB也有硬件架构的改进,中Intel在核显增加了视频专用硬件,实现硬解视频流。

在核显内部是Eu执行单元、多媒体处理器、还有格式转换、顶点着色器、光栅化引擎等。其中,媒体处理器引擎是视频操作的关键。在视频编码方面,核显内的MuIti-Format Co-dec(MFX)是一个并行的解码引擎,它支持MPEG2,VCl,AVC等,该引擎全面为CPU优化,并且不必占用EU阵列。同时,在运算的时候,引擎可以直接操作LLC(终端缓存即三级缓存)来节省内存带宽,并且可以提升效率。

配置独立显卡效能测试

在3D测试中可以看出,RTS类型的游戏会更加受到CPU的影响,并且SNB的超大三级缓存也占了不少优势,不过在一些常规的游戏大作中,高负载的3D渲染下,CPU表现出来的性能差异不大,即使是6核1090T处理器也起不到多核的优势。由于SNB支持超线程技术,因此可以在一些乱序执行的应用中得到更好的效率。同时由于处理器的动态频率调节算法的调整,让处理器的功耗可以瞬间突破TDP,带来性能的爆发性提升。在一些测试中也可以窥探到其优势,Turb02.0技术支持四个核心同时小幅超频,这为了对多核优化的游戏提速,同时也支持双核大幅超频,可以让双核优化的程序飙升性能,在最坏情况的单线程应用中,处理器更可以超越TDP的限制,让串行代码执行的效率媲美多线程。

总结:随着微架构的变化,SNB效能有很大提升,特别在性能功耗比上更表现出Intel的优势。性能的增加得益于三级缓存的变化以及处理器流水线的优化,指令先行缓冲区的加强让指令命中率得到很好提升,使其更加适应复杂的应用。

SNB除了处理器本身有优化外,核显的性能也得到质的提高,3DAPI更可以支持到10.1。核显可以流畅地运行时下的大众游戏。当然此次的SNB系列主要面向中端主流以及入门级用户,至于终极高端产品依旧是1366架构的Corei7-990X,而继任者LGA2011引脚Ivy Bridge将在数月后公布,届时将会和AMD推土机正面交锋。