分享

INTEL CPU全系列架构发展史(转载)

 善哉善斋 2015-10-08
 
壮士断腕,Conroe临危受命
  在很久很久以前的286时代,英特尔还只是一个小公司,它负责给IBM提供IBM PC中的微处理器。那会儿,IBM PC销量很大,兼容机还没出现。为了能保证微处理器供货充足,上帝般的IBM强迫英特尔将微处理器技术无偿授权给另一家公司。看IBM脸色吃饭的英特尔虽然老大不愿意但也没办法,最后选择了AMD作为微处理器技术无偿提供对象(一不小心养虎成患,现在英特尔估计后悔到死)。为了制约AMD,英特尔又将微处理器技术无偿授权给了Cyrix。
1982年2月1日,英特尔推出80286微处理器
  在当时来说,英特尔除了产能占优外,在技术上是没有任何优势的,三家公司的微处理器架构基本一致。但是这时候,IBM公司内部倒产生了巨大的分歧:许多人反对快速转换到286计算机的生产和销售,因为这会对IBM的小型机与之前的PC XT销售造成影响,他们希望过渡的步伐能慢一些。
  但英特尔并不能等,80286处理器已经批量生产了,不可能堆在仓库里等IBM慢慢消化。此时康柏公司就钻了空子——快速推出286的IBM PC兼容机,并一举打败IBM成为PC市场的新霸主。随着IBM PC兼容机的大量涌现,英特尔处理器也卖得越来越多,名气越来越大,实力与日俱增,也就不用再唯IBM马首是瞻了。
  1993年3月22日,英特尔发布新一代P5架构586微处理器,这款历史性的产品被英特尔命名为Pentium(奔腾),并不再对AMD和Cyrix授权。
1993.3.22 英特尔推出里程碑式的Pentium处理器
  而AMD也非昔日可比了,它具有很强的研发能力,并很快发布了K6处理器迎战,更逐渐衍生出K6-2和K6-3处理器。K6-2处理器凭借架构上的优势令英特尔感到了巨大的压力。为此1995年英特尔又推出新的P6架构取代奔腾/奔腾MMX的P5架构,以求在性能上保持领先地位
1995.11.1 英特尔推出采用P6架构的Pentium Pro
  最早采用P6架构的微处理器是高能奔腾(Pentium Pro)。P6架构与奔腾的P5架构最大的不同在于,过去集成在主板上的二级缓存被整合到处理器内,从而大大地加快了数据读取时间和提高命中率。另外,P6架构是一个纯32位的微处理器架构。
1997.4.7 英特尔推出Pentium II
  为了将P6架构平价化,以对抗AMD等竞争对手,英特尔采用了将二级缓存从CPU核心移出,改用外置于集成CPU核心的PCB板上的做法,这“萌生”了1997年推出的奔腾II处理器。奔腾II处理器的二级缓存外置于CPU核心以外,只能以处理器工作主频一半的速度运行,而不像奔腾Pro的二级缓存那样以全速运行。随着0.25微米工艺的成熟,英特尔才尝试重新将二级缓存集成在核心内。
  为了进一步巩固自己的领导地位,英特尔1999年1月推出了PentiumIII。
1999.1 英特尔推出PentiumIII
  在PentiumIII时代之前,AMD和Cyrix一直是英特尔的追随者,但是AMD Athlon推出之后,历史发生了微妙的变化:在AMD推出Athlon 650MHz的时候,英特尔处理器的最高主频才550MHz,这也是英特尔第一次被竞争对手超过!为了保住自己颜面,英特尔匆匆推出了采用0.18微米工艺,代号"Coppermine"的奔腾III处理器,主频有500MHz至700MHz几个型号。
  这时候英特尔与AMD主频之争的激烈程度前所未有,我们熟悉的频率“攀比”战开始了。
  最先达到1GHz主频的是AMD的Athlon处理器,同频的奔腾III处理器在落后不到一个月面世,但这足以让AMD自豪了。由于1GHz的Athlon性能不敌1GHz奔腾III,AMD决定开发核心整合二级缓存的Athlon XP。
  随后英特尔霸王硬上弓,抢先推出1.13GHz的奔腾III,在性能上领先倒是领先了,但当时的0.18微米工艺生产1.13GHz的奔腾III实在是勉为其难。后果就是全面回收几乎不能正常运行的奔腾III 1.13GHz处理器。而此时,AMD推出了1.1GHz Athlon XP处理器。
◆ 饱受责难的NetBurst架构奔腾4
2000.11.20 英特尔推出Pentium4

  英特尔在AMD强大的压力下,开始鼓吹“唯主频论”。在奔腾III及以前的微处理器时代,是一个处理器性能与主频紧密结合的时代。那个时候无论是英特尔还是AMD,他们的处理器产品在主频提升的同时,同样也会带来相应的性能提升。到了奔腾4,英特尔的“唯主频论”颠覆了“性能等于主频”的传统观念。
  2000年11月20日,英特尔正式发布了NetBurst架构的奔腾4。这不仅仅是一款新产品的发布,它还标志着一个处理器新时代的开始。奔腾4 1.4 GHz/1.5 GHz的出现,吸引了全世界的眼光。然而有专业媒体质疑:为何奔腾4的主频这么高,但是实际测试项目很多都不如P6架构的1GHz奔腾III呢?英特尔回答:奔腾4是一种全新的架构,它的性能不能再用传统的观点去评判。
  奔腾4能够在同样的0.18微米工艺下轻松达到2GHz,而奔腾III 去到1.13GHz就已经到了极限,这是因为奔腾4的运算流水管线多达20级甚至31级,而奔腾III只有11级。运算流水管线越长,就越容易在同样制造工艺下达到更高的工作主频。Athlon在同样制造工艺下可以达到奔腾III难以达到的高主频,就是因为Athlon的运算流水管线比奔腾III略长。但是运算流水管线过长也会带来负面影响,管线越长,单位主频下的处理器执行效率就越低,性能的发挥就会受到影响。
  第二代Northwood核心的奔腾4采用了0.13微米工艺制造,较好地解决了发热与功耗的问题,迅速成为市场主流。此后随着800MHz FSB、超线程等新技术的引入,Pentium 4 NetBurst架构的威力的以充分发挥,所以从性能/功耗上来讲,这个时候的奔腾4达到了巅峰。
  随着主频的不断攀升,NetBurst架构的弊端越来越明显。第三代Prescott奔腾4流水线达到31级,晶体管达到了125百万个(Northwood只有55百万个),以至于它每个时钟周期比Northwood多产生大约60%的热量,同时功率消耗也增加大约10%!3.2GHz的Prescott TDP达到了触目惊心的103W!人们开始戏称Pentium 4为烤炉,高主频带来的高功耗使得英特尔的忠实支持者要为奔腾的芯付出更多的电费,同时更要忍受高性能处理器风扇所带来的巨大噪音……
64岁的英特尔总裁贝瑞特面对着6500人惊天一跪:“请原谅我们”(2004.10)

  奔腾4最终止步于3.8GHz,原计划推出的4GHz奔腾4处理器也被胎死腹中。英特尔意识到处理器研发道路上走入了“唯主频论”的误区,2004年10月,英特尔总裁贝瑞特惊天一跪,面对着6500人说道:“请原谅我们”,真心地对公司的失误表示忏悔。
  英特尔终于承认自己错了。不要忘记当初英特尔发布奔腾4时吹嘘说奔腾4是为10GHz的运算速度设计的,这是到目前为止英特尔历史上最重要的或许也是最广为人知的工程失败事件。
◆ 临危受命的Core微架构
  实际上,英特尔除了拥有NetBurst研发小组外,还有一支位于以色列海法的研发团队。该以色列团队早在2003年就因为设计出兼具高性能与低功耗的Banias移动处理器而闻名天下,Core微架构是他们最新的杰作,由于NetBurst架构的失败,Core微架构一下就成了英特尔的救命符。
  2006年3月英特尔在春季IDF大会宣布下一代处理器将采用的Core微架构。英特尔指出未来处理器的技术发展重点将是“每瓦特性能”(Performance per Watt)。而这届IDF的主题更加明确:功耗最优化平台(Power-Optimized Platforms)。根据英特尔的说法,采用Core微架构的处理器将在性能方面得到极大的飞跃,肯定将超过竞争对手AMD的产品。
  更好的消息Core在功耗方面将比前任大幅下降。
Core微架构将一统江湖
  Core微架构被英特尔推上前台,被赋予了取代NetBurst微架构、一统桌面、移动与服务器平台的历史使命。针对笔记本、桌面级用户和服务器,Core均有不同的产品。
  Conroe是基于Core微架构的桌面平台级产品(我们常说的“扣肉”),由于“Core”和“Conroe”两个单词在结构上颇为类似,因此有不少消费者往往便认为“Core”和“Conroe”指得是同样一种产品。实际上,我们通常把“Core”直接音译为“酷睿”,它是Intel新一代处理器产品统一采用的微架构,而Conroe(扣肉)只是对基于Core(酷睿)微架构的桌面平台级产品。
  除桌面的Conroe处理器之外,Core微架构还包括代号为“Merom”的移动平台处理器和代号为“Woodcrest”的服务器平台处理器。
  由于上一代采用Yonah微架构的处理器产品被命名为Intel Core Duo,因此为了便于与前代双核处理器区分,Conroe以及Merom都将采用相同的命名方式——Core 2 Duo。另外,Intel最高性能的桌面服务器芯片Woodcrest将命名为Core 2 Extreme,以区分于普通桌面/笔记本处理器产品。
  Conroe处理器沿用了L1 Cache设计,L1数据Cache和L1指令Cache分别为32KB,两个核心共享4MB或2MB的L2 Cache,它结合了Pentium M高效率和NetBurst动态执行性能优越两方面的优点。Conroe处理器的数据流水线长度从Prescott的31级大幅度缩短至目前的14级。其算术逻辑运算单元ALU数量由上代NetBurst微构架的2组提升至3组,同时在Cache构架上也经过了大幅度的改良,整体运算性能大大增加。
Core微架构与Yonah微架构
  目前比较普遍的看法是,Core微架构是Pentium Pro架构,或者说是P6微架构的延续。Core微架构中只有预取机制是从NetBurst微架构获得的灵感,所有其它的设计都是从Yonah微架构(Core Duo处理器)演变而来,而Yonah微架构是从Banias处理器和Dothan处理器演变而来的。所有Banias、Dothan、Yonah和采用Core微架构的处理器都继承了NetBurst处理器的前端总线设计,但除此之外,它们毫无疑问都是曾经获得巨大成功的P6微架构的后代。
  英特尔P6微架构的总工程师之一Robert Colwell在其回忆录中表示他之所以离开英特尔,主要就是因为他并不认同英特尔在NetBurst微架构中所选择的设计路线,因为他相信“The future is mobile”,如何在维持省电与最长电池续航能力的前提下,达到足够的运算效能,才是处理器技术发展的未来方向。NetBurst微架构的失败,与P6微架构的复兴,恰恰证明了英特尔之前策略的失败和他的远见。
  不过这并不意味着只是把Yonah处理器的一些功能单元和解码器重新包装一下然后换了个名字就推出来。英特尔Core开发人员称,Woodcrest、Conroe和Merom处理器都是基于Yonah处理器的,但是几乎80%的架构和电路设计需要重新进行。
2006.7.27 英特尔Conroe全球同步上海发布会
  2006年7月27日,英特尔全球同步发布基于其Core微架构的Conroe桌面平台处理器,承接6月发布的服务器处理器Woodcrest,以及8月登场的笔记本处理器Merom,英特尔处理器全面从上一代NetBurst微架构转向新的Core微架构。
◆ 解读Core微架构
  英特尔对Core微架构的要求非常高,需要有很好的跨平台性,又要兼顾到功耗,最重要的是能提供更高的性能。其中特别引人注意的就是英特尔在Core设计中导入的全新的每瓦特效率的设计概念,因为这个概念的出现将真正影响未来英特尔处理器架构的发展,而这也对产业发展产生了重大的影响。
  Core微架构的目标就是构建一个高效的双核心架构,因此采取共享式二级缓存设计,2个核心共享二级缓存。内核采用高效的14级有效流水线设计,每个核心内建4组指令解码单元,支持微指令融合与宏指令融合技术,每个时钟周期最多可以解码5条X86指令,并拥有改进的分支预测功能。每个核心内建5个执行单元,执行资源庞大。采用新的内存相关性预测技术。支持增强的电源管理功能。支持硬件虚拟化技术和硬件防病毒功能。内建数字温度传感器。还可提供功率报告和温度报告等,配合系统实现动态的功耗控制和散热控制。
  重要的一点是,Core微架构加入了对EM64T指令集的支持,随着Windows Vista的到来以及Intel、AMD全面更换到64bit处理器,64bit计算的普及只是时间问题。
  ·14级指令执行流水线设计

  流水线深度一直是影响处理器效率的重要因素,流水线深度的增加可以让处理器时钟频率进一步提高,但带来的反面影响就是处理器的单周期执行效率降低、发热量上升,同时容易产生分支预测等问题,Prescott核心的P4达到了31级流水线长度,要比当年的Pentium III和Athlon处理器高出许多,也让Prescott最终走上失败之路。
  在Core架构中,其指令流水线深度达到14级,这个深度是要高于Pentium M的12级,但是却比AMD的K8处理器架构的17级要低上3级。目前的Core架构是兼顾执行效率和降低功耗的折中设计。
  流水线的“条数”与“级数”是完全不同的概念。能够完整执行各种指令的一系列功能单元组成“一条”流水线。而关于流水线级数,可以这样简单理解:一条流水线所包含的功能单元一般可以被划分为多个部分,它可以被划分成几个部分,就称这条流水线是“几级”的。
  Core微架构的14级有效流水线与Prescott核心的31级有效流水线的对比,也只有参考意义。那些仅仅根据这个数字的对比就断言Core微架构只能达到很低的频率的说法是不具有足够的说服力的。Conroe XE 3.33GHz处理器的存在已经让很多相信这个说法的人大吃一惊。而实际上,已经有很多玩家在风冷下将Conroe处理器超频达到4GHz以上的频率。
  除此之外,Core微架构加入了五大重要创新,其中包括宽区动态执行(Intel Wide Dynamic Execution)、高级智能高速缓存(Intel Adcanced Smart Cache)、智能内存访问(Intel Smart Memory Acess)及高级数字媒体增强技术(Intel Adcanced Digital Media Boost)、智能功率能力(Intel Intelligent Power Capability),这里我们就只是对这五大重要创新作个简单介绍:
  ·宽区动态执行(intel Wide Dynamic Execution)

  宽区动态执行(Intel Wide Dynamic Execution)技术就是通过提升每个时钟周期完成的指令数,从而显著改进执行能力。通俗的说就是,每个内核将变得更加“宽阔”,这样每个内核就可以同时处理更多的指令。
  毫无疑问,Core微架构是一个比NetBurst或Yonah微架构更宽的设计。Core微架构拥有4组解码单元,每周期可以生成7条微指令;Yonah 微架构拥有3组,每周期可以生成6条微指令;而NetBurst微架构由于解码方式不同,不容易比较解码单元的数目,但是NetBurst微架构每周期只能生成3条微指令。
  Core微架构把解码单元增加到4组,这个变化可以说是Core微架构最大的特色之一。X86指令集的指令长度、格式与定址模式都相当混乱,导致X86指令解码器的设计是非常困难的。增加解码单元,特别是复杂解码单元,固然会大大增强处理器的解码能力,但是解码单元复杂的电路也必然会提高内核的复杂度和处理器的功耗。权衡利弊,英特尔最终选择了增加1组简单解码单元的折衷方案。
  此外,Core架构的每个核心都拥有3个算术逻辑单元(ALU),而之前的NetBurst仅有2个ALU,P6架构的处理器仅为1个,这样的设计使得Core架构拥有比较高的处理能力。
  酷睿微体系结构在提升每个时钟周期的指令数方面做了很多努力,例如新加入宏融合(Macro-Fusion)技术,它可以让处理器在解码的同时,将同类的指令融合为单一的指令,这样可以减少处理的指令总数,让处理器在更短的时间内处理更多的指令。酷睿架构也改良了ALU以支持宏融合技术。
  ·高级智能高速缓存(Intel Advanced Smart Cache)
  以往的多核心处理器,其每个核心的L2缓存是各自独立的,这就造成了L2缓存不能够被充分利用,并且两个核心之间的数据交换路线也更为冗长,影响了处理器工作效率。如果采用L2缓存共享设计,那么只需要数据被载入到L2缓存中,数据可以被两个核心同时使用。
  这样做的另一个好处是每个内核之间都共享着更大的L2缓存,其缓存可以被任何一个核心所独占,这样理论上每个核心都有可能获得100%的L2缓存掌控权,特别是对于一些单核心优化的程序,由于不需要使用到第二个核心,这种时候,第二个核心自动关闭降低功耗,而第一个核心可以共享双倍于单核L2缓存容量的空间来存放数据,要知道高速L2缓存的容量越大,可以使得总体效率也有响应提升。
  ·智能内存访问(Intel Smart Memory Access)
  智能内存访问是另一个能够提高系统性能的特性,通过缩短内存延迟来优化内存数据访问。智能内存访问能够预测系统的需要,从而提前载入或预取数据,反映到用户的直接使用体验上,就是大幅提高了执行程序的效率。
  以前我们要从内存中读取数据,就需要等待处理器完成前面的所以指令后才可以进行,这样的效率显然是低下的。而Core架构中可以智能地预测和装载下一条指令所需要的数据,从而优化内存子系统对可用数据带宽的使用,并隐藏内存访问的延迟。该目标是为了确保能够尽快地使用数据,并使该数据可能地用于需要的地方,以将延迟最小化,最终提高效率和速度。
  智能内存访问包含一项重要的被称作内存消歧(Memory DisaMBIguATIon)的新能力,该能力提高了乱序处理的效率,因为它可以为执行内核提供内建的智能,以帮助其在执行完所有预先存储的指令前,预测性地载入指令即将需要执行的数据。除内存消歧外,英特尔智能内存访问还包含增强的预取器。预取器负责“预取”内存内容,并将其放入高速缓存中,以备读取。增加从高速缓存而非内存的装载量将缩短内存延迟并提高性能。
  总之,改进的预取器和内存消歧通过最大化可用系统总线带宽和隐藏内存子系统延迟,提高了执行吞吐率。
  ·高级数字媒体增强技术(Intel Advanced Digital Media Boost)
  性能=频率×每个时钟周期的指令数,英特尔高级数字媒体增强是为了提高每个时钟周期的指令数而诞生。它是一项可以显著提高执行SIMD流指令扩展(SSE)指令性能的特性。128位SIMD整数算法和128位SIMD双精度浮点操作减少了执行特定程序任务所需的全部指令数,将能够促使整体性能的增高。
  Core微架构的上一代Yonah具有一个比较明显的缺点,只具有64bit的SIMD运算架构,在涉及到128位SIMD运算的时候,需要两个时钟周期才能完成,效率非常低下,Yonah也因此难以实现64bit运算,而Core微架构经过改良之后,可以单个周期就能完成同样的操作,效率提高达一倍。Intel配合这个改进,并结合新的SSE3指令集,并称为Intel Advanced Digital Media Boost。
  ·智能功率能力(Intel Intelligent Power Capability)
  NetBurst架构、Prescott核心处理器的耗电/功耗表现向来被竞争对手和用户诟病,因此新一代Core架构在功耗上进行改进也就十分重要,并被称为Intel Intelligent Power Capability,包括采用了先进的65nm Strained Silicon应变硅技术、Low-K介质等技术,还对各个运算部件都单独加入了电源控制功能,仅在需要的时候才开启相应工作电路。先进的能源管理技术让Core架构的处理器的功耗表现很出色,这也是Conroe处理器迅速被用户接受的一个重要因素。
◆ Intel Core2处理器技术一览 EIST、ClE、TM2、VT、XD
EIST技术
  EIST全称为Enhanced Intel SpeedStep Technology,是Intel专门为移动平台和服务器平台处理器开发的一种节电技术,它能够根据不同的系统工作量自动调节处理器的电压和频率,以减少耗电量和发热量。到后来,从Pentium 4 6xx系列开始Intel把这项技术也移植到桌面处理器上。
ClE技术
  ClE全称为C1E enhanced halt stat,它首次出现是在Pentium4 5xxJ系列处理器上,取代了以前的Pentium 4处理器和其它大部分x86处理器中的所常用的C1 halt state。C1 halt state由操作系统idel进行发出的HLT命令触发,然后处理器就会进入到低功耗的挂起状态(halt state)。最新的C1E halt state也是由HLT命令触发的,它是通过调节倍频来逐级的降低处理器的主频,同时还可以降低电压。?
C1E与EIST的不同
  EIST的触发机制同C1E halt state是不同的,它的运作需要BIOS和操作系统的支持(Windows XP SP2/Windows Server 2003 SP1/Linux 2.6 kernel 或更新的版本),由操作系统通过ACPI进行调节。简而言之,EIST能更有智慧地来管理处理器资源,可以根据必需的处理器负载程度与系统速度来自动调整处理器的电压与核心频率,而且调节的级别更加的细致,因此相比C1E halt可以更加精确的调节处理器的状态。
Thermal Monitor2(TM2)
  TM2全称Thermal Monitor2,是Intel在LGA775封装的Prescott核心处理器中增加的新的过热保护机制。类似于Pentium4处理器中的温度回馈装置TM1(Thermal Monitor1),当处理器过热时,Pentium4处理器的主频会降低一半,此时功耗也会降低一半,从而降低处理器温度达到保护处理器安全的目的。与TM1相比,TM2可以提供更智能,更有效的处理器热量功耗的管理方式,在保证处理器基本性能的前提下尽可能在满负荷情况下降低处理器的功耗和温度。
  TM2的主要工作方式仍然是通过TCC进行处理器主频的控制,不过它被称为“Enhanced TCC(增强型TCC)”,通过调节处理器的倍频和输入电压来降低处理器的功耗。
  TM2为处理器的工作状态预设了两个点:第一点的工作状态是正常的主频和核心电压;第二点是低主频和低电压点。一旦TM2侦测到处理器的温度上升到预设的警戒温度时,E-TCC电路被激活,调整处理器的第一点主频和电压,朝着第二点的预设值转换。这一转换的过程非常快――仅5微妙。在转换的这段时间之内,处理器不能响应系统总线的访问请求的。
  处理器的主频降到预设的低值之后,便会向主板上的电压控制模块发出新的电压识别信号(VID Code)。因此,要实现TM2,主板的电压控制模块必须支持处理器的多电压转换过程,具备较低的电压输出能力。在处理器电压转换的过程中,可以接受系统总线对其的访问,执行指令。
  处理器温度下降到正常值时,处理器的工作主频和电压便会朝正常的值上升。首先上升的是电压,这样可以保证处理器恢复到正常频率工作后的稳定性(因为低压高频一般会导致处理器工作不稳,就像加压超频的原理)。
  一款支持TM2的处理器在TCC激活的情况下发生的变化。当温度触及设计上限时,首先是PROCHOT#信号变为低电平,接着主频下降至低点预设值。电压在保持一段时间后会以0.0025v为步进下降,到达预设低点。温度下降一段时间后PROCHOT#变为高电平,首先是电压重新上升到正常值,接着主频会恢复到正常水平。
VT
  VT是Virtualization Technology(虚拟化技术)的缩写,它能够可以让一个CPU工作起来就像多个CPU并行运行,从而使得在一部电脑内同时运行多个操作系统成为可能,它的出现能够使用户在他们的个人电脑上建立多套虚拟的运行环境以便能够在同一台个人电脑上运行不同的操作系统。VT还能够允许IT技术管理员下载系统补丁或者升级个人电脑的一部分的同时,用户能够在另一个虚拟环境中运行他们的应用程序。根据Intel的资料,Intel虚拟技术的实现需要同时具有处理器、芯片组、BIOS、VMM软件的支持,这些特定的平台软件必须全部到位,同时性能方面要视不同的硬件和软件平台而定。
Virtualization技术和多任务(Multitasking)、HyperThreading超线程技术的不同
  Virtualization技术和多任务(Multitasking)、HyperThreading超线程技术是完全不同的。多任务是指在一个操作系统中多个程序同时并行运行,而在虚拟技术中,你可以拥有多个操作系统同时运行,每一个操作系统中都有多个程序运行,每一个操作系统都运行在一个虚拟的CPU或者是虚拟主机上。而HyperThreading超线程只是在SMP系统(Symmetric?Multi?Processing)中单CPU模拟双CPU来平衡程序运行性能,这两个模拟出来的CPU是不能分离的,只能协同工作。

Execute Disable Bit
  Intel Execute Disable Bit(简称“XD”)中文译作“英特尔防病毒攻击内存保护机制”,开启该功能后,可以防止病毒、蠕虫、木马等程序利用溢出、无限扩大等手法去破坏系统内存,抑制病毒的复制和传播,避免速度变慢、死机等故障的出现。其工作原理是:处理器在内存中划分出几块区域,部分区域可执行应用程序代码,而另一些区域则不允许。要实现处理器的“Execute Disable Bit”功能,还需要操作系统的配合才行。现在Windows XP SP2、Windows Server 2003 SP1、Linux 9.2及Red Hat Enterprise Linux 3 Update 3等均支持这一功能。


◆ Core微架构桌面平台处理器全解析
  在去年7月27日,英特尔正式发布Core微架构的桌面平台处理器Conroe系列,发布之日一共推出有五款处理器,即Core 2 Extreme X6800、Core 2 Duo E6700、Core 2 Duo E6600、Core 2 Duo E6400和Core 2 Duo E6300。然而即便是最低档的E6300,其价格也要183美元(当时约1450元人民币)。显然光有好的性能还不足以抢占更多市场份额,价格是另一个主要原因。
小知识:Conroe命名规则  Conroe处理器根据TDP电源功耗的不同分为E、T、L、U四个等级,采用E开头的为50W以上产品,T打头的为24-49W产品(主要是移动处理器),L代表15-24W产品,U代表14W以下产品。第一个数字表示产品家族,第二个数字表示产品的SKUs。

  最初的Conroe市场定位较为尴尬,其狭窄的市场空间造成了产品叫好不叫座境况。英特尔要想彻底击垮AMD,单单靠中高端Conroe产品是不可能的,最完美的做法就是尽快将Conroe系列细分。基于此原因,英特尔随后推出了很多款Core架构的桌面平台处理器,涵盖高中低端市场。
英特尔桌面处理器最新采购价(点击放大)

  英特尔的桌面处理器产品线大致上可以按照核心数量、前端总线频率、二级缓存、核心频率四大主要特征进行区分。在加入新一批酷睿2处理器之后,整个桌面处理器产品线中,处于最顶端的产品当然是拥有四个物理核心,1333MHz FSB,8MB L2缓存和3GHz核心频率的Core 2 Extreme QX6850,它也是目前整个桌面处理器市场最先进和最高端的产品。
  主流市场Core 2 Duo(C2D)系列,包括E6000系列(E6850、E6750、E6700E6600、E6550、E6540、E6420E6400E6320E6300)、E4000系列(E4500、E4400、E4300,第四季度将会推出E4600),红色字体的型号表示将被淘汰,下同。
  入门级市场Pentium E2000(PDC,Pentium Dual-Core)系列,虽然打着Pentium的旗号,但采用的Core微架构,现有E2140和E2160两款,第四季度将会发布E2180。
  高端市场Core 2 Quad(C2Q)系列,这是四核心的处理器,现有Q6700和Q6600两款产品。
  至尊版的Core 2 Extreme(C2E)系列,现有QX6850、QX6800、QX6700X6800四款产品。
  另外在低端市场还有采用Conroe-L核心的Celeron 400系列,有440、430和420三款产品。
英特尔桌面处理器规格表(点击放大)

英特尔最新桌面处理器Roadmap(点击放大)

  ·中端王牌Core 2 Duo E6000系列
  E6000系列是英特尔主流市场的王牌,目前这个系列一共有十个型号的处理器有售。FSB从最初的1066MHz全面提升到1333MHz,原来1066MHz的六款产品将陆续会停产。
小知识 Core 2处理器的一些共有技术  EM64T 64位运算和64位内存控制技术,Enhanced Intel SpeedStep Technology(EIST,增强型SpeedStep技术),Mutilple VID动态电压技术,Execute Disable Bit(缩写为EDB、XDB或XD)硬件防病毒功能,Virtualization Technology(VT)虚拟化技术,SSE指令集,SSE4指令集等,这些都是Core 2处理器的共有技术。

  在今年4月,英特尔对其全系列产品线进行了大幅的价格调整,并在调价的前一天发布了Core 2 Duo E6300/E6400的升级版Core 2 Duo E6320/E6420。其采用4MB L2 Cahce的增强设计,相比起原有的优势在于缓存翻倍,但价格则与E6300/E6400完全保持一致。早期的E6300/E6400均是通过屏蔽的方式把B2 Stepping的L2 Cahce实现为2MB,而E6320/E6420则是把被屏蔽的2MB缓存释放,使得产品的缓存规格与配置与较为高端的E6600/6700保持一致,有利于产品线的进一步延伸。
  同样是在英特尔调价的日子,7月22日,英特尔推出了六款的Core 2处理器,其中有四款Core 2 Duo处理器,即Core 2 Duo E6850/E6750/E6550/E6540。E6x50系列+“3”系列芯片组,让英特尔平台正式进入1333MHz FSB时代,能与未来DDR3内存更好的配合,提升系统整体带宽。1333MHz FSB的Core 2采用了最新的G0步进,据了解,这一版本相比之前的B2并没有提供什么技术上的革新,不过很多玩家发现,新的G0步进在超频方面的表现很不错,并且功耗相比之前又有进一步的降低。E6540除不支持TXT和vPro技术外与E6550相同。
  英特尔的这次处理器命名方式很有意思,启用E6x50的命名模式,这一方面为了区分同老处理器之间的差别,同时也可以让用户支持处理器之间的实际性能差异,譬如E6750的工作频率同E6700一样,均为2.66GHz,但由于E6750采用1333MHz的总线,因此在数据吞吐量上是占有优势的,因此可以理解为E6750的效率更高;而E6550的实际工作频率为2.33GHz,而E6600的工作频率为2.4GHz,因此用户也可以由命名知道,E6550的效率要比E6600低一些
  在E6x50处理器中,加入了新的Intel Trust Execution Technology(简称Intel TXT)技术,配合新一代的Microsoft Vista操作系统,能够提供更强大的数据安全与保护解决方案。由于TXT是处理器、芯片组及I/O系统所提供的硬件功能,因此这一功能甚至可以凌驾于所有软件甚至是操作系统之上。
  ·中低端主流Core 2 Duo E4000系列
  在Pentium D以及Pentium 4处理器慢慢淡出市场后,英特尔用什么来巩固中低档市场呢?此前基于Core架构最低端的处理器就是Core 2 Duo E6300,但是其超过160美元的售价还是会让很多人望而生畏。英特尔自然知道这个问题,早就想好了应对的办法,在今年1月,英特尔推出了代号为Allendale的E4000系列的首款产品Core 2 Duo E4300,矛头直指1000元左右的处理器市场。
  为了进一步拉开产品之间的距离,英特尔让这种新一代的处理器将提供800MHz的系统总线,而不是原本Core 2 Duo E6xxx那样的1066MHz的总线上,E4300始频率为1.8GHz,稍低于E6300,不过9倍频设计更受超频爱好者欢迎,二级缓存为2MB,E4000系列处理器在功能方面还删减了虚拟技术(Intel VT)和商业用博锐技术(Intel VPro),虽然如此,对于64位操作系统支持、ED Bit防病毒技术、EIST节能技术,还有以家庭娱乐为主题的欢悦技术(Viiv)都一一保留,因此功能方面的差异没有太大影响。
  E4300是首款采用原生2M二级缓存设计的Intel Core 2 Duo处理器,后期的E6300和E6400也是采用这种设计,此举将降低CPU的制作成本。
  在4月,英特尔又推出了2.0GHz的E4400,并计划在Q3和Q4分别推出2.2GHz和2.4GHz的E4500、E4600。
  ·入门级处理器Pentium Dual-Core E2000系列
  2007年6月3日英特尔发布新款双核心处理器Pentium Dual-Core E2000系列以及单核心的Celeron 400系列,旧有NetBurst微架构向Core微架构的过渡已进入尾声。
  英特尔显然没有因为Core 2 Duo系列的成功而轻易放弃“Pentium”这块金字招牌。不过其与先前的双核心产品Pentium D却有着天壤之别。“Pentium Dual-Core”形象地向我们传达出它是一款基于Core微架构设计的双核心处理器,而“E2000”则又很容易地使我们将其同“Core 2 Duo”中的“E6000”以及“E4000”联系起来。
  Pentium Dual-Core E2000系列同我们所熟悉的Core 2 Duo E4000系列的差异仅存在于处理器二级缓存容量(1MB)和对于Intel欢跃技术的支持上。若将两者的具体规格进行对比,我们发现PDC E2000系列相当具有诱惑力。
  E2000目前采购价格E2140、E2160分别在74、64美元,并且目前市场来看,实际零售价格可能会更具吸引力。
  ·低端杀手Conrol-L单核心Celeron 400系列
  就现阶段而言,价格偏高也许是Core 2 Duo系列的缺点,虽然千元以下有PDC E2000系列支撑,但在500元以下市场,Core微架构处理器还是一片空白。英特尔自然不甘心放过这一巨大市场,Core微架构处理器将无处不在。于是Conroe-L以“单核心Core 2”为卖点切入低端级处理器市场,高效能功耗比和低价格无疑将成为英特尔的杀手锏。
  2007年6月3日,基于Core微架构的Conroe-L单核心微处理器“Celeron 400”系列正式发布,截止至2007年第三季度,存在了长达7年之久的单核心Pentium 4系列将正式退出主流零售市场。
  Celeron 420、Celeron 430和Celeron 440成为率先问世的Conroe-L核心处理器。
  Conroe-L将采用与Conroe一样的LGA775接口,单核心设计,前端总线800MHz,二级缓存512KBB,支持EDB(XD)防毒技术、EM64T技术等,但不支持虚拟化(VT)技术和EIST(增强SpeedStep)省电技术。
Conroe-L、Allendale(E4000)和Conroe三个核心处理器对比

  Conroe-L和Conroe最大不同之处在于采用的是单核心的架构,而这也意味着与Conroe相比,Conroe-L其中一个核心将被屏蔽。由于Core架构采用了共享缓存的技术,当被关闭了其中一个核心,相应的缓存也会被关闭,而性能损失随之增大。但由于它有了Conroe核心灵魂附身,所以它的性能依然不弱。
  相比Cedar Mill核心Celeron D 3xx的533MHz FSB,Celeron 400系列的800MHz FSB能让性能有较大提升,而且Celeron 400系列的TDP耗能仅为35w,较之Cedar Mill核心Celeron D 3xx的65w降低了46%。
  ·Core 2 Extreme至尊版处理器

  Core 2 Extreme(C2E)系列主要是针对发烧级和高端应用推出的。在第一批上市的Conroe中,就有Core 2 Extreme X6800,也是当时桌面处理器中性能之王。和Core 2 Duo相比,X6800仅仅是频率上的提升,最好的消息应该是Extreme系列没有锁倍频,可以往上调(其它系列只能往下调倍频),更利于超频。当然X6800的TDP为75W,比Core 2 Duo的65W要高。
  在2006年11月,英特尔发布了四核心的Core2 Extreme QX6700,处理器内部将两颗DIE封装在一起,每两个核心共享4M L2缓存,通过一条的FSB与内存沟通。两个酷睿2核心整合在一起就很快地设计出新的四核产品。对于厂商来说,这样的好处是可以让四核很快地面世,而它的并行处理能力提高幅度也是令人满意的。但问题是如果核心A需要调用核心B L2缓存内的信息则需要通过FSB的中转,无形当中影响了处理器的速度。
两个酷睿2核心整合在一起就设计出新的四核产品

  今年四月,英特尔又推出了更高频率的2.93GHz的QX6800。在7月22日,英特尔发布了最顶端的Extreme QX6850,频率达到了3.0GHz,FSB提升到了1333MHz,无疑是当今桌面级处理器的最强者。还有一个最高的,那就是$999的QX6850采购价。
  四核心的Extreme系列处理器TDP达到130W,也是目前桌面处理器中最高的。
  ·高端市场的Core 2 Quad四核处理器

  在发布四核心的Core 2 Extreme QX6700后不久,英特尔推出价格更低的Core 2 Quad Q6600四核产品,也是第一款上市的Core 2 Quad系列处理器,Core 2 Quad系列将和双核心的Core 2 Duo系列一起构成目前Intel在桌面市场的主打产品。
  Core 2 Quad系列在架构上和Core 2 Extreme四核心版本相同,1个封装当中包含了2个Core 2 Duo核心。Q6600的工作频率从QX6700的2.66GHz下降到2.4GHz,同时TDP功耗也从130W下降到105W,FSB还是跑1066 MHz,二级缓存8MB(每2核心共享4MB)。后期改良了工艺的G0制程Core 2 Quad Q6600处理器TDP降低到了95W。
  在7月22日,英特尔发布了新的Core 2 Quad Q6700处理器,频率为2.66MHz,其它规格不变。目前Q6700的采购价为$530,Q6600的采购价为$266(和C2D E6850一样),很好地填补了C2D和C2E间的空白。
◆ 独立测试:1333MHz FSB能带来多少性能提升?
  根据Intel的计划,新一代的45nm Penryn处理器将在2007年第三季度面世,而在此之前,Intel将通过1333MHz FSB的Core 2 Duo 6X50系列处理器来保持效能优势和巩固市场份额。
  为了与上一代1066MHz FSB的产品进行区分,1333MHz FSB版本处理器代号中第三个数字由“0”改为“5”。首批的1333MHz FSB的6X50处理器包括四核的QX6850(主频3.0GHz),双核的E6850、E6750、E6550(主频分别为3.00GHz、2.66GHz和2.33GHz)四款,除了拥有“传统”的虚拟机技术(VT)、增强型节能技术(EIST)及EDB防病毒技术等功能外,它还首次加入商业运用的Intel Trust Execution Technology(简称Intel TXT),提供进一步的数据保全方案。Intel在稍后还会推出E6540,它可以看作是E6550不支持TXT和vPro技术的简化版。
  其实6X50并不是Intel首款1333MHz FSB的产品,早在Conroe发布后不久的2006年年底Intel就在Xeon 5000系列上率先引入了1333MHz FSB规格。而最新的6X50系列+“3”系主板芯片组,则让英特尔桌面平台正式进入1333MHz FSB时代。1333MHz规格的带宽高达10.7GB/s,比1066MHz FSB的8.5GB/s提升了26%,能与未来DDR3内存更好地配合,籍此Intel可以继续保持在桌面平台效能和技术的双重领先。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多