分享

原生四核处理器

 雅韵风乐收藏阁 2018-04-28

原生四核+全新缓存设计+有八个逻辑内核

我们知道,Core 2 Quad系列四核处理器其实是把两个Core 2 Duo处理器封装在一起,并非原生的四核设计,通过狭窄的前端总线FSB来通信,这样的缺点是数据延迟问题比较严重,性能并不尽如人意。Core i7则采用了原生四核设计,采用先进的QPI(QuickPath Interconnect,下面将进行介绍)总线进行通讯,传输速度是FSB的5倍。

缓存方面也采用了三级内含式Cache设计,L1的设计和Core微架构一样;L2采用超低延迟的设计,每个内核256KB(256x4 KB);L3采用共享式设计,被片上所有内核共享,容量为8MB。

采用全新QPI总线

Core i7的Nehalem架构最大的改进在前端总线(FSB)上,传统的并行传输方式被彻底废弃,转而采用基于PCI Express串行点对点传输技术的通用系统接口(CSI),被Intel称为QuickPath。QuickPath的传输速率为6.4GT/S,这样一条32bit的QuickPath带宽就能达到25.6GB/sec。QuickPath的传输速率是FSB 1333MHz的5倍,前者虽然数据位宽较窄,但传输带宽仍然是后者的2.5倍。由于分别用于双处理器和单处理平台,Gainestown有两条QuickPath,而Bloomfield仅有一条。不难看出,在AMD推出HyperTransport高速串行总线,并逐渐在高性能运算领域建立优势之后,Intel也迎头赶上。若干年前,关于串行传输将一统天下的预言已经变成了现实,我们所要等待的是串行内存何时重返市场。

集成内存控制器

内存控制器相信大家不会感到陌生,竞争对手AMD早在K8时代CPU已经集成了内存控制器,能大幅提升内存性能,而Intel方面则表示由于时机还不合适,因此没有在Core2中使用,现在最新的Core i7终于拥有集成内存控制器IMC(Integrated Memory Controller),可以支持三通道DDR3内存,运行在DDR3-1333,内存位宽从128位提升到192位,这样总共的峰值带宽就可以达到32GB/s,达到了Core 2的2-4倍。处理器采用了集成内存控制器后,它就能直接与物理存储器阵列相连接,从而极大程度上减少了内存延迟的现象。

同步多线程技术

超线程技术(Hyper-Threading),最早出现在130nm的Pentium 4上,超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。超线程技术使得Pentium 4单核CPU也拥有较出色的多任务性能,现在通过改进后的超线程技术再次回归到Core i7处理器上,新命名为同步多线程技术(Simultaneous Multi-Threading,SMT)。

同步多线程(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同时执行2个线程。对于执行引擎来说,在多线程任务的情况下,就可以掩盖单个线程的延迟。SMT功能的好处是只需要消耗很小的核心面积代价,就可以在多任务的情况下提供显著的性能提升,比起完全再添加一个物理核心来说要划算得多。比起Pentium 4的超线程技术(Hyper-Threading),Core i7的优势是有更大的缓存和更大的内存带宽,这样就更能够有效的发挥多线程的作用。按照INTEL的说法,Nehalem的SMT可以在增加很少能耗的情况下,让性能提升20-30%。

为什么Core 2没有使用SMT?很显然,它是可以做到的。SMT是在节省电力的基础上增加了性能,而且软件支持的基础建设也早就有了。有2个可能的原因:一是Core 2可能没有足够的内存带宽和CPU内部带宽来利用SMT获得优势。通常,SMT能够提升内存级并行(memory level parallelism,MLP),但是对于内存带宽已经成为瓶颈的系统则是个麻烦。而更有可能的原因则是SMT的设计、生效等是很麻烦的,而当初设计SMT是由INTEL的Hillsboro小组主持,而并非是Haifa小组(Core 2是由这个小组负责的)。这样Core 2不使用SMT就避免了冒险。

自动超频,核心加速

Turbo Mode,顾名思义,就是加速模式,它是基于Nehalem架构的电源管理技术,通过分析当前CPU的负载情况,智能地完全关闭一些用不上的核心,把能源留给正在使用的核心,并使它们运行在更高的频率,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。这样,在不影响CPU的TDP情况下,能把核心工作频率调得更高。

举个简单的例子,如果游戏只用到一个核心,Turbo Mode就会把其他三个核心自动关闭,把正在运行游戏的那个核心的频率提高,也就是自动超频,在不浪费能源的情况下获得更好的性能。Core 2时代,即使是运行只支持单核的程序,其他核心仍会全速运行,得不到性能提升的同时,也造成了能源的浪费。

Turbo Boost默认是开启的,通过自动调高CPU的倍频提高性能。在Intel原厂X58主板上,低负载时默认调高1-2个倍频。例如Core i7 920默认频率为2.66G,在Turbo Boost默认是开启的情况下,运行Super PI是以单核2.8G来跑,这样单线程性能也就得到提升。

超频爱好者也许会想到,Turbo Mode自动提升的那个频率可以手动调整吗?如果可以,不就能利用它进行超频吗?答案是可以的,只要是Exterme Edition CPU,就可以手动调整,好好利用,新的超频方式从此诞生。

文本处理再提速!完整SSE4指令支持

完整的SSE 4(Streaming SIMD Extensions 4,流式单指令多数据流扩张)指令集共包含54条指令,其中的47条指令已在45nm的Core 2上实现,称为SSE 4.1。SSE 4.1指令的引入,进一步增强了CPU在视频编码/解码、图形处理以及游戏等多媒体应用上的性能。其余的7条指令在Core i7中也得以实现了,称为SSE 4.2。SSE 4.2是对SSE 4.1的补充,主要针对的是对XML文本的字符串操作、存储校验CRC32的处理等。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多