跌落凡间的火种!(全文)

开篇：润墨网以专业的文秘视角，为您筛选了一篇跌落凡间的火种!范文，如需获取更多写作素材，在线客服老师一对一协助。欢迎您的阅读与分享！

根据InteI的策略，2011年刚好到了lntel踏入钟摆战略的微架构升级期，(产品研发代号：sandyBridge文中简称sNB)clarksfield处理器首次把GPu加入到CPu封装里，而SNB则把融合技术更进一步。此次改变主要集中对处理器智能方面的优化，其中包括智能加速、电源管理、内置核显等。

SNB主要采用了全新图形处理技术，并对高清视频、图片处理、3D加速、多任务处理、多媒体等应用做出优化。sNB所有型号均内置了新一代核芯显卡，同时还配备了H.264解码器。在电源管理方面，芯片采用智能真体(笔者译)实现高效管理，下文我们一起探讨SNB的秘密。

SNB概览

SNB延续了Nehalem架构的优势，同时在前者的基础上做出了重大改进。借鉴了i系列产品线的深入民心，产品型号继续采用i7／i5／i3命名规则，定位上i7面向中高端人群，而i5主要给中端主流消费群体，i3则是入门级别的处理器。当然，上市的SNB并没提及发烧定位，所以发烧的消费用户还是由前一代产品Core i7 Extreme坐守，而取代i7六核的规格将由lvy　Bridge完成。

SNB处理器包含了两条产品线，一是桌面系统，另一条是移动处理器。型号上，重点带K系列以及不带K的处理器，sNB新特征

新的SNB架构被命名为Visual　smart，即“智能视觉”架构，从命名中可以看出处理器有两大核心改进，一是智能，二是视觉运算。在智能方面在，主要表现在SNB的Turb02.0技术，以及智能节能技术。在视觉领域上，SNB内嵌了专门的视频编解码电路，可以高效地实现H.264等编解码的运算。除此之外，SNB更加入了AVX高级向量指令，支持256位宽的操作，

SNB架构深入解析

CPU架构

SNB放弃了之前CPU核心与显示核心分离的设计，改用了处理器核心融合显示核心，在clarksfield的时期，两者是依靠QPl总线传输数据，同时效能上有所不足。而新的SNB架构则采用了共享3级缓存设计，可以大大加强异构核心之间的数据传输，同时CPU和GPU可以对等地操作数据，减少数据延时，这也为带K级别的CPU不锁倍频，面向超频玩家级用户，当然价格也会较高，而不带K的产品则锁定倍频，外频较难再往上攀升。此指令类似于sIMD指令，可以高性能实现向量操作以及数据密集型的运算。

本处理器的一大亮点是内置的显示核心以及CPU同样采用32nm工艺制成，漏电方面控制十分出色，保证了良好的功耗控制。在SNB系列的处理器中均具有核显，即高端到低端的型号也内置了显示核心。

SNB分为桌面级以及移动级产品线，内置的显示核心分为HD3000和HD2000两种，前者配备12个执行单元，后者具备6个执行单元。在移动处理器上，全部系列内~_HD3000核显，而且桌面级的处理器只有带K后续的型号才制成HD3000核显，其余均配置HD2000核心。笔记本的省电高效创造条件。

超标量超流水线：一般处理器都采用超流水线架构，也就是说把一个复杂的操作分为多个操作，然后运用指令集的并行来减少复杂操作的延时。而超标量也就是说明了处理器具备多个指令发射器，每次可以并行发射数条指令，从而增加指令吞吐量。SNB在超标量以及超流水线上都有了较多的改进，增加了指令执行的效率。

指令分支预测改进：在处理器的流水线上为了每个执行部件处于满载状态，必须有多个缓>中区，以便指令速度的同步。在缓冲区里面存储的是已翻译的指令，当指令没发生跳转的时候，会按照顺序相安无事地执行下去。但是，当遇上了跳转情况，便很难说了，如果跳转的深度超过了缓冲区的深度时，那么高速缓存的数据便要重新清空，因此之前编译指令的工作量就会全部白费，而且也会造成流水线的效率低下。

指令分支预测主要是预知那些即将转跳的指令，减少不必要的无用功。SNB中加入了不少的预测改进；其中有第二层分值预测缓存，这类似于当拾取到分值指令时，第二个目标缓>中区负责拾取可能跳转地址所在的指令。还有就是循环检测，这个类似for(a)；语句中，如果a为真则继续跳转，当循环语句可观时这是个巨大的效能损失，因此需要检测循环来把它的逻辑取反来避免语句被)中掉。

加强的先行微指令缓冲区：指令缓冲区的作用在于把编译好的指令存放在高速的缓存上，这样可以增加指令重叠执行的概率，譬如拾取指令的同时，可以进行译码，并且同时进行指令的执行。当然，如果这三个步骤都对应同一个指令的时候，便是一种串行执行，效率十分低下。先行缓存区的目的就是这三个步骤异步执行，譬如有三条指令，当你执行第一条指令的时候，译码器同步地翻译第二条指令，而且执行拾取器在取地三条指令。

SNB处理器在指令队列后面增加了微指令缓存(uop缓存)，作用就是上述所说的先行缓存。当指令经过一级高速缓存后，被预编译，这里可以把一些空指令等预先处理，然后就会被拾取到指令队列，队列后就被硬件编译成微指令。而SNB增加的Uop缓存正好在编译指令之后，用于存储已经便宜好的微指令。

Uop缓存采用直接映射的机制，即地址映射是一一对应，它能存储大约1.5K微指令，相当于6KB指令缓存。Uop存储的指令区别于一级指令缓存，L1存储的是未经编译的指令，而Uop存储的是已被编译处理好的指令代码，因此执行速度远高于L1，并且其指令的命中率都能达到80％左右，它的带宽也更高，速度几乎和物理寄存器相当。Uop缓存地位就相当于0级缓存，也就是在32KB一级数据缓存和32KB一级指令缓存后更加接近CPU内核的一层硬件，增加此设计可以大大加强CPU的指令速度，而且也有效减少因分支问题导致CPU流水线断层。

AVX高级向量指令：一般的标量指令，指的是单指令但数据流(sIsD)的意思，也就是说一条指令只能有一个操作数，但是随着多媒体等数据密集型的操作越来越广泛，CPU也渐渐增加了单指令多数据流，从开始的MMX(又名妈妈叉)指令，到烽火一时的SSE指令。

到了SNB架构上，Intel更增加了全新的向量指令AVX，其支持256bit操作数，适用于视频编解码工作，即使对像素的操作有较大的性能优势。AVX也就是SIMD指令，支持单指令多数据的操作，十分适合数据密集型的算法。

核显

SNB在内置显卡方面做出的改进十分大，其公布的性能提升为前代产品的两倍，即HD3000性能为Core i5 661的翻倍。规格上，SNB拥有两款核显，一个是HD3000，另一个是HD2000，前者内置12个核心，而后者拥有6个渲染单元，规格刚好相差一倍。频率设定上HD2000为850MHz睿频到1100MHz，2600K为可以睿频到1350MHz。

架构上，SNB的核显最大不同是采用了三级共享缓存的设计，其中核显和CPU内核共同通过环形总线去访问三级高速缓存，可以有效地提升效率。内核的环形总线架构类似于AMD早期在2900XTX时的环形访问总线，总线拥有四条独立的环组成，分别是数据环(DT)、请求环(QT)、响应环(RsP)、侦听环(sNP)。每条环的每个接入点在每个时钟周期内都能接收32字节数据，而且环的访问总会自动选择最短的路径，以缩短延迟。协议上采用环形总线的令牌协议，因此具备良好的系统扩展性。

测试平台

测试描述：本次测试采用第二代Core　i7的最高规格处理器2600K，对比的处理器有Core i5-750以及AMD的高端6核处理器1090T。测试分为两个部分，一是处理器性能的测试，主要体验处理在运算能力，浮点、整数操作的速度。另外的测试是为了搭建一个平衡的3D游戏平台，采用高端显卡GTX580，同时游戏的测试设置为最高画质，虽然这样测试会让CPU的性能权重减少，但是此情况更加适用于我们日常应用的模拟。

多媒体性能　 SNB的多媒体性能比前代产品又有质的提升，除了支持传统SSE多媒体指令外，SNB更新增了AVX指令，当软件支持此指令时效率会有翻倍的提高。另一方面，在视频处理上，SNB也有硬件架构的改进，中Intel在核显增加了视频专用硬件，实现硬解视频流。

在核显内部是Eu执行单元、多媒体处理器、还有格式转换、顶点着色器、光栅化引擎等。其中，媒体处理器引擎是视频操作的关键。在视频编码方面，核显内的MuIti-Format Co-dec(MFX)是一个并行的解码引擎，它支持MPEG2，VCl，AVC等，该引擎全面为CPU优化，并且不必占用EU阵列。同时，在运算的时候，引擎可以直接操作LLC(终端缓存即三级缓存)来节省内存带宽，并且可以提升效率。

配置独立显卡效能测试

在3D测试中可以看出，RTS类型的游戏会更加受到CPU的影响，并且SNB的超大三级缓存也占了不少优势，不过在一些常规的游戏大作中，高负载的3D渲染下，CPU表现出来的性能差异不大，即使是6核1090T处理器也起不到多核的优势。由于SNB支持超线程技术，因此可以在一些乱序执行的应用中得到更好的效率。同时由于处理器的动态频率调节算法的调整，让处理器的功耗可以瞬间突破TDP，带来性能的爆发性提升。在一些测试中也可以窥探到其优势，Turb02.0技术支持四个核心同时小幅超频，这为了对多核优化的游戏提速，同时也支持双核大幅超频，可以让双核优化的程序飙升性能，在最坏情况的单线程应用中，处理器更可以超越TDP的限制，让串行代码执行的效率媲美多线程。

总结：随着微架构的变化，SNB效能有很大提升，特别在性能功耗比上更表现出Intel的优势。性能的增加得益于三级缓存的变化以及处理器流水线的优化，指令先行缓冲区的加强让指令命中率得到很好提升，使其更加适应复杂的应用。

SNB除了处理器本身有优化外，核显的性能也得到质的提高，3DAPI更可以支持到10.1。核显可以流畅地运行时下的大众游戏。当然此次的SNB系列主要面向中端主流以及入门级用户，至于终极高端产品依旧是1366架构的Corei7-990X，而继任者LGA2011引脚Ivy Bridge将在数月后公布，届时将会和AMD推土机正面交锋。

跌落凡间的火种!

优秀范文