分享

GPU七年提升了75倍! 全面解析Haswell

 金刚光 2022-02-27
2013-06-06 05:15:00  [  中关村在线 原创  ]   作者:

1GPU七年提升了75倍! 全面解析Haswell

  规格、型号和参数都已尘埃落定。大家终于看到Haswell第四代酷睿核芯的真面目了。按照英特尔的“Tick-Tock”工艺架构路线图,Haswell走到了架构变革的一代。处理器核芯在制程工艺不变的前提下进行框架革新,而这样的变化则更多代表了英特尔22nm的先进和成熟。其实早在今年的IDF 2013技术峰会上英特尔就已经就给我们详细阐述了Haswell的相关信息。而本次台北电脑展上,英特尔则更加清晰透彻的介绍了Haswell所具备的特性和优点。

GPU七年提升了75倍! 全面解析Haswell

  在Haswell诸多的特性中,CPU性能的提升已不再是大家兴奋点所在,而核芯显卡才是真正吸引大家眼球的关键。按照英特尔官方的说法,与上一代相比Haswell核芯显卡图形性能提升1倍。回顾近年来英特尔从集成显卡到核芯显卡的更新历程,在短短的七年时间里,GPU性能提升了75倍。尤其是2009年进入酷睿时代后,CPU与GPU融合趋势加剧,CPU基本上每一次以10%左右的性能稳步提升,而图形性能则以每一代翻倍的惊人速度跃进。

GUP七年提升了75倍! 全面解析Haswell
英特尔处理器核芯显示性能七年提升了75倍

GUP七年提升了75倍! 全面解析Haswell
从2010年开始,英特尔处理器集成核芯显卡

  到了Haswell这一代,框架结构得到进一步优化,核芯显卡性能再上一个台阶。这对于便携性更强的笔记本来说无疑带来了更高的图形显示效果。同时,Haswell更加注重低功耗、电源管理方面的优化。最新的消息表明,英特尔已经重定义了超极本规范,要求全新超极本至少支持6小时HD视频连续播放,9小时以上开机续航,不少于7天待机时间。同时要求三秒钟从睡眠模式快速唤醒。这充分证明Haswell被称作“英特尔史上产品换代中,电池续航时间最大幅度的提升”。 

2GPU面积增大 倾向提升核显降低功耗

·GPU面积增大 倾向提升核显降低功耗

  Haswell架构简图:其实跟Sandy Bridge、Ivy Bridge是一脉相承的,不过GPU所占据Die的面积的确是越来越大了。四核心GT2的晶体管数量14亿个(是上一代比反而少了0.8亿个),核心面积177平方毫米(增大了17平方毫米)。

GUP性能七年提升了75倍! 全面解读Haswell核芯
Haswell架构图

  对于笔记本平台,Haswell处理器的封装形式依然会有PGA以及两种BGA,其中PGA则面向普通移动版处理器,而两种BGA则是专门面向超极本领域。

  PGA封装的代号为PGA12,它拥有946个触点,目前Ivy Bridge处理器PGA封装的触点数量为988个,这就意味着两代处理器核芯无法互相兼容。

  BGA封装的代号为BGA12F,触点数却有1168(双核)个1364(四核)两个,而目前Ivy Bridge处理器BGA封装的触点数则分别是1023(双核)和1224(四核)个,同样无法向下兼容。

Haswell更加倾向降低功耗

  Haswell不仅仅是架构上的微调,其他方面的改进还包括空闲功耗,以及在空闲状态和激活状态切换过程中的功耗。英特尔引入了一种新的“激活空闲”功耗状态,这也被英特尔称作SOix。在这种状态下,系统可以继续收发数据,同时不必完全激活CPU和GPU。这意味着系统在非“激活”状态下能完成更多工作,减少了激活CPU所需的能耗。

GPU七年提升了75倍! 全面解析Haswell

  Haswell架构的动态设计最大的好处之一就是带来更低的功耗,其在工作的时候可以进行功耗的动态分配,全负荷运转只会针对那些高强度工作,而此时的能耗也最高;但如果是日常工作,在不需要全负荷的情况下,闲置的功能则会进入休眠状态。

  虽然在Ivy Bridge当中也有类似功能,但Haswell则对其加以了改进,实用性可以达到上一代产品的20倍。也就是说有可能比上一代产品节电20倍。根据英特尔的数据,采用Haswell处理器的笔记本电池续航时间比采用Ivy Bridge处理器的笔记本最多长1/3。 

3核芯显卡型号对号入座 性能有哪些不同?

·核芯显卡型号对号入座 性能有哪些不同?

  Haswell中GPU是整个框架革新的重点,在命名和型号上将会划分为前所未有的多个档次,其中带128MB eDRAM缓存的GT3e看点最多,GT3e的正式型号将叫做锐炬Pro 5200,性能属于最高端。Haswell处理器的GT3核芯显卡有两种,锐炬系列对应TDP 28W的产品,高端GT3叫做锐炬Graphics 5100,而TDP 15W产品仍然是HD Graphics系列,具体产品对位是HD Graphics 5000。以上5000系列图形核芯均具备40个EU单元。

型号核芯命名图形核芯核芯单元DRAM功耗性能高低
GT3eIris ProIris pro520040个EUeDRAM(128MB)28W
GT3IrisIris510040个EU28W
GT3HD GraphicsHD500040个EU15W
GT2HD GraphicsHD4600/4400/420020个EU
GT1HD Graphics




  GT2则对应的是核芯显卡HD 4600/4400/4200,拥有图形核芯为20个EU单元,相比上一代HD 4000多出4个EU单元。GT1就是简单直接没有任何编号的HD Graphics,隶属于奔腾赛扬系列专用,后续可能还会在Atom上出现。

  看到Haswell核显型号后,大家肯定觉得有些一时摸不着头脑。简而言之,就是新4000系列都是归于GT2,而5000则都属于GT3,性能排序GT1<GT2<GT3<GT3e。等到Haswell机型大面积上市后,大家在选择笔记本的时候,就要多注意核显这一项参数,因为在性能上还是存在一些差异的。如果一时间无法区分开核芯性能高低的话,不妨可以参考上面这张编辑自己整理的表格。

  就目前我们拿到Haswell机型中,配置都属于GT2这一档,其中已经曝光是HD 4600和HD 4200,性能方面比起上一代HD 4000有一定提升。前期搭载锐炬5000系列核芯显卡的笔记本暂时还没有看到,不过有外媒测试后性能表现相当出色,真机面世也许要等上一段时间。

4命名规则略有变化 主要区别核显规格

·命名规则略有变化 主要区别核显规格

  按照英特尔处理器发布规律,首先推出的就是高端版的酷睿i7系列,随后才会释放酷睿i5和酷睿i3,这和之前的节奏是一样的。但实际上,酷睿i5已经悄悄偷跑。Haswell发布会解禁的当天,英特尔官方网站就已经更新了处理器的规格、型号和详细参数。总体来看,Haswell命名规则基本和上一代保持一致,不过一些数字标识和字母标识方面还是稍稍有点变化的。其中,核芯显卡与以往的命名方式有比较大的区别,下面我们先来看看酷睿i7的一些命名规则。

Haswell全面解读
英特尔第四代酷睿智能处理器命名规则

前面酷睿和iX标识和上一代完全相同的,不做更多介绍。变化主要是中间四位数字和最后两位字母。

第一位“4”:代表英特尔酷睿第四代处理器;

第二位“5”“6”“7”“8”“9”:这些数字代表处理器等级排序,数字越大性能等级相对越高;

第三位“3”“5”“0”:这一位基本上就是对应核芯显卡的型号,其中“3”代表高性能处理器配HD 4600;“5”代表核芯显卡采用的是Iris 5000、5100或者Pro 5200;而“0”则是HD 4600;

第四位“0”“2”“8”:“0”在标准电压中代表47W,而在低电压中是代表15W;“2”则代表37W,“8”在低电压处理器中代表28W;

第五位“MX”“HQ”“MQ”“U”:字母“MX”代表旗舰级,“HQ”封装方式FCBGA1364,并且部分支持Trusted Execution Technology和博锐技术,“MQ”版本封装方式FCBGA946,“U”代表超低电压以15W和28为主;

Haswell酷睿i7处理器规格信息
处理器内核线程主频睿频高速缓存TDP核显动态频率
酷睿i7-4930MX483 GHz3.9 GHz8 MB 57 W HD  46001.35 GHz
酷睿i7-4550U241.5 GHz3 GHz4 MB 15 W HD  50001.1 GHz
酷睿i7-4650U241.7 GHz3.3 GHz4 MB 15 W HD  50001.1 GHz
酷睿i7-4700HQ482.4 GHz3.4 GHz6 MB 47 W HD  46001.2 GHz
酷睿i7-4700MQ482.4 GHz3.4 GHz6 MB 47 W HD  46001.15 GHz
酷睿i7-4702HQ 482.2 GHz3.2 GHz6 MB 37 W HD  46001.15 GHz
酷睿i7-4702MQ 482.2 GHz3.2 GHz6 MB 37 W HD  46001.15 GHz
酷睿i7-4800MQ482.7 GHz3.7 GHz6 MB 47 W HD  46001.3 GHz
酷睿i7-4900MQ 482.8 GHz3.8 GHz8 MB 47 W HD  46001.3 GHz
酷睿i7-4500U241.8 GHz3 GHz4 MB 15 W HD  44001.1 GHz
酷睿i7-4558U242.8 GHz3.3 GHz4 MB 28 W Iris 51001.2 GHz
酷睿i7-4950HQ482.4 GHz3.6 GHz6 MB 47 W Iris Pro  52001.3 GHz
酷睿i7-4850HQ482.3 GHz3.5 GHz6 MB 47 W Iris Pro  52001.2 GHz
酷睿i7-4750HQ482 GHz3.2 GHz6 MB 47 W Iris Pro  52001.2 GHz

后缀说明:M-移动处理器 Q-四颗核芯 U-超低功耗 X-至尊 Y-极低功耗 H-BGA1364封装


  英特尔官方网站首批移动版酷睿i7处理器共有14款,其中TDP为57W的只有一款,就是之前我们评测过的酷睿i7-4930MX,不过其搭载的核芯显卡是HD 4600,并不是大家想看到的Iris Pro 5200。另外,酷睿i7 M、H系列也有细微的区别,初看后可能会认为H代表高性能、M代表主流。结果恰恰相反,M系列CPU频率比H系列更高,只是GPU没有使用最好的GT3e,旗舰型号Core i7-4930MQ的热设计功耗也唯一达到了57W。

Haswell酷睿i5、i3处理器规格信息
处理器内核线程主频睿频高速缓存TDPSDP显卡型号动态频率
酷睿i3-4010U241.7 GHz不支持3 MB 15 W  HD  44001 GHz
酷睿i3-4100U241.8 GHz不支持3 MB 15 W  HD  44001 GHz
酷睿i3-4010Y241.3 GHz不支持3 MB 11.5 W6 W HD  4200850 MHz
酷睿i3-4158U242 GHz不支持3 MB 28 W  Iris  51001.1 GHz
酷睿i5-4250U241.3 GHz2.6 GHz3 MB 15 W  HD  50001 GHz
酷睿i5-4350U241.4 GHz2.9 GHz3 MB 15 W  HD  50001.1 GHz
酷睿i5-4200U241.6 GHz2.6 GHz3 MB 15 W  HD  44001 GHz
酷睿i5-4200Y241.4 GHz1.9 GHz3 MB 11.5 W6 W HD  4200850 MHz
酷睿i5-4258U242.4 GHz2.9 GHz3 MB 28 W  Iris  51001.1 GHz
酷睿i5-4288U242.6 GHz3.1 GHz3 MB 28 W  Iris  51001.2 GHz


  除了酷睿i7外,官方网站也展示了酷睿i5和酷睿i3的具体规格。酷睿i5和i3低电压版分为U和Y两种系列,命名规则中主要也区别在后四位上。拿其中的酷睿i5-4200Y和酷睿i5-4258U为例,第一位“4”是第四代酷睿处理器;第二位的“2”则是产品序列,个人理解理论上数字越高性能越好;第三位数字“5”代表的是核芯显卡系列HD 5000以及Iris(锐矩)5100,“0”和“1”都是HD 4400和HD 4200;第四位“0”代表15W,而如果标注数字是“8”的,TDP则是28W,最后一位字母U依然代表低电压,而全新的“Y”字母则代表更低功耗的11.5W。 

  注:在表格中有一项SDP是之前没有过的,英特尔以往使用热设计功耗(TDP)来衡量计算机在最差情况下的功耗,即CPU全速运行一段时间的功耗。目前,英特尔引入了一个新概念,即场景设计功耗(SDP)。这主要衡量计算机在媒体播放等轻量级应用下的功耗。英特尔将以SDP来衡量用于平板电脑和笔记本的的处理器。可以看到,只有超低功耗的11.5W处理器上才会有SDP场景设计功能。

5HD 4600基准测试 图形性能提升显著

·HD 4600基准测试 图形性能提升显著

  目前已经测试的两台搭载Haswell笔记本中,核芯显卡均为HD 4600,通过实际的基准测试后,对比目前主流的独显笔记本性能,基本上可以代替中低端独显。

CPU性能小幅拔高 Haswell核显提升60%
  核芯显卡HD 4600获得了23524分

CPU性能小幅拔高 Haswell核显提升60%
3DMark Vantage(Entry)显示性能对比

  从基准测试成绩上看来,的确Haswell核芯显卡的性能提升是明显的,3DMark Vantage E模式下获得了23524分,拿这个成绩与上一代HD 4000相比,提升幅度达到了52%。账面上数字成绩直观反映了性能提升高低,单以这样的理论成绩看,已经超过不少曾经市面上较为流行的独立显卡。 这里需要说明的是,如果整机其他硬件、驱动程序和时钟差异考虑进去,HD 4600有30%左右的提升(对比HD 4000)。

6游戏性能曝光 核芯逐渐逼近中端独显

·游戏性能曝光 核芯逐渐逼近中端独显

★《生化危机5》

  作为最为经典的第三人称游戏,生化危机5以绚丽的场景和逼真的效果赢得了很多玩家的喜爱,同时要想得到流畅画质和完美效果,机器必须拥有强悍的图形处理能力,尤其在场景复杂的情况下。所以这款游戏也成了很多玩家测试机器图形能力的最佳之选。

与Haswell同步亮相 华硕A450JF首发评测
画质与分辨率设置

与Haswell同步亮相 华硕A450JF首发评测
最终测试成绩为“B” 平均帧数为33.2FPS

  《生化危机5》是一款对机器图形处理能力要求较高的游戏,不过上一代英特尔HD 4000核芯显卡已经可以流畅运行,而最新HD 4600的成绩更上一层楼,平均帧数竟然到达了33.2FPS。

★《街头霸王4

  街头霸王4一直都是竞技对抗游戏的经典之作,水墨画的设计风格、绚丽的场景需要大量的数据运算,也给机器的图形处理性能提出了一定的要求。所以游戏帧数和实际效果将成为评测电脑图形性能的一个衡量标准。

与Haswell同步亮相 华硕A450JF首发评测
画面设置与分辨率调整

与Haswell同步亮相 华硕A450JF首发评测
最终获得“B级评定 分数为9292分 平均帧数52.97FPS

  从测试结果来看,在拥有英特尔新四代HD 4600核芯显卡之后,用户可以高品质的流畅运行《街头霸王4》,而从测试成绩来看,在1366×768的分辨率下,特效默认,并且关闭垂直同步后,整个游戏测试环节画面的平均帧数高达52.97FPS,相比上一代HD 4000的平均39.18FPS有了不小的进步。

7指令集升级为AVX2 编码解码效率更高

·指令集升级为AVX2 编码解码效率更高

  指令集方面Haswell新增不少,尤其是AVX2最具看点,AVX2 指令集增强了对256bit整数SIMD的支持,新增60条256bit浮点SIMD指令,在AVX的基础上进一步完善。另外在浮点运算上,新增的FMA 单元支持8个单精度或4个双精度浮点数,每周期单/双精度FLOPs都要比AVX高一倍。这些改善都显著提升了处理器的浮点和整数运算性能。

  AVX2是由AVX指令集扩展增强而来的,为绝大多数128位SIMD整数指令带来了256位数值处理能力,同时继续遵循AVX的编程模式。除此之外,AVX2还提供了一系列增强的功能性,包括数据元素的广播(broadcast)、逆变(permute)操作,每个数据元素可变位移计数的矢量位移指令,从内存中拾取非相邻数据元素的指令等等。

Haswell全面解读
第四代酷睿智能处理器指令集升级

  具体的扩展包括以下几个方面:支持的整点SIMD数据宽度从128位扩展到256位。Sandy Bridge虽然已经将支持的SIMD数据宽度增加到了256位,但仅仅增加了对256位的浮点SIMD支持,整点SIMD数据的宽度还停留在128位上。

  增强广播、置换指令支持的数据元素类型、移位操作对各个数据元素可变移位数的支持、跨距访存支持。根据资料显示,每核心每时钟周期的单精度、双精度浮点均翻一番,可执行两个FMA操作,还有其他一些新的指令。一级、二级缓存的管理方式和容量都没变,但得益于AVX2,带宽均翻了一番,对于AVX2代码和老代码都有效。   

  其中最为重要的是对256位的整数SIMD的支持,并新增60条256位浮点SIMD指令,完善从AVX开始的256位扩展,理论上可再次提升整数和浮点运算速度。仅仅通过这一项指令集的提升,处理器峰值浮点运算单元的运算能力就可以翻倍。

全面解读Haswell
GPU支持的API

★编码解码:

  除了显示功能进行了升级外,Haswell的GPU也可以对不同封装格式的视频/图片进行硬件加速。比如可以解码JPEG、Motion JPEG、MVC(Multi-view Video Coding)以及SVC(Scalable Video Codec)等流媒体。

  此外CPU也可以解码MPEG2、SVC,而且在AVC方面也有所加强。除了编码外,更多的显示功能也被加入到了Haswell的GPU中,比如通过色域转换功能可以使显示出的色彩尽可能与文件原色彩一致;而Frame Rate Conversion(帧率转换)类似于一种插帧功能,可以在相邻两帧中插入新帧,让视频播放的更流畅。此外还有一些其他新功能,比如视频防抖、支持高帧JEPG等。

★GPU支持的API:

  Haswell将配备三种GPU,包括GT1、GT2和GT3,它们的3D引擎会有一些改进,比如支持更宽的数据路径,具备更好的采样、几何单元。此外,它们将支持最新的DirectX 11.1、OpenGL 3.2、OpenCL 1.2等API。据英特尔官方介绍,GT1的性能将比HD2500高15~25%,GT2的性能将比HD4000高15~25%,GT3的性能将比HD4000高50~100%。

英特尔展台:Haswell流畅播放高清视频
Haswell平台的笔记本可以流畅播放4K

  另外,拥有Haswell平台的笔记本可以流畅播放4K(指分辨率为4096×2160的数字电影,即横向有4000个像素点,是目前分辨率最高的数字电影)级别超高清影片,而功耗仅为15W。这似乎预示着,随着Haswell平台的正式发售,在未来几个月中超极本完全有能力流畅播放超高清4K视频。    

8与游戏厂商合作 为核显优化增加特效

·与游戏厂商合作 为核显优化增加特效

  由于Haswell核芯显卡已经具备了中端独显的性能,因此英特尔已经开始着手和游戏厂商进行密切合作,针对核芯显卡进行优化处理,使得核显可以渲染出更多逼真的特效。Codemasters在日前正式发布了新一代的赛车类游戏《GRID2》,同时AMD也成功的将其纳入了Gaming Evovled阵营的怀抱,很有可能还会进行Never Settle捆绑销售。

  而英特尔Haswell上的锐炬显卡也开始行动起来。外媒爆料称《GRID2》不仅仅对A卡做了优化,对Haswell核显也作出了优化,部分型号的核显甚至还能够运行英特尔的专属特效。这些都要得益于Haswell核显中加入了两条新的指令集,其中一条PixelSync指令能够让游戏开发商使用OIT(不规则透明)来制作出逼真的烟雾效果。

GUP七年提升了75倍! 全面解析Haswell
无发光体积烟雾效果

GUP七年提升了75倍! 全面解析Haswell
使用PixelSync之后的发光体积烟雾效果

  当然,以核芯显卡的性能来说想要运行《GRID2》本来就是一件比较困难的事情,所以外媒称只有HD 5200及其以上的核芯显卡才能够享受到这一特效,而目前新一代集成eDRAM缓存的Iris Pro 5200只有在部分超极本才会配备,因此主流级玩家可能会错过这一独享特效。

总结与市场分析:

  从这一代Haswell可以看到,英特尔已经不再那么追求性能上的大幅度提升,转而向节能降耗和图形处理能力提升而努力。一方面进一步解决了笔记本超极本续航时间不理想的问题,同时核芯显卡性能提升也直接打乱了笔记本市场的分布格局。而另一个方面,Haswell则有意向平板电脑和手机市场发起冲击,Haswell优化框架结构对于低功耗要求严格的小尺寸移动设备,显然是至关重要的。

  PC市场能否摆脱颓势,Haswell加Window 8的组合被寄予很高的期望。二合一形式的触控超极本将是今年英特尔重点的推广方向。此外,由于核芯显卡性能的提升,如果用户不是忠实的游戏玩家,不带独显的主流笔记本出货量将会变大,尤其是英特尔主推的超极本会受到更多消费者的青睐,而超低电压超极本价格也会因此有一定下降的空间。

  Haswell整体性能不但可以满足日常使用需求,同时还带来了极致便携、快速响应、低功耗、低热量和长续航等方面的优势,后续等大量机型出货后,上述特点将成为消费者选购笔记本着重考虑的因素。 

大家终于看到Haswell第四代酷睿核芯的真面目了。按照英特尔的“Tick-Tock”工艺架构路线图,Haswell走到了架构变革的一代。

李诺 PCH是Paging Indicator CHannel的缩写,译为寻呼信道。是北桥中的内存控制器和PCIe控制器都集成到了CPU内部,相当于整个北桥芯片都集成到了CPU内部,主板上只剩下南桥.所以PCH可以理解成南桥.目前Intel的有些SOC就是连PCH也集成到了CPU内部,比如:Intel Xeon D系列.


寻呼信道是用于传送与寻呼过程相关数据的下行传输信道,用于网络与终端进行初始化时。最简单的一个例子是向终端发起语音呼叫,网络将使用终端所在小区的寻呼信道向终端发送寻呼消息。 
当网络想与某一MS建立通信时,它就会根据MS所登记的LAC号向所有具有该LAC号的小区的PCH信道上进行寻呼,寻呼MS的标识为TMSI或IMSI。用于传输基站寻呼移动台的信息,寻呼信道属于下行信道,点对多点传播方式。 
在非组合CCCH的51复帧中共9个的CCCH块,其中包括PCH块和AGCH块.一般城市里AGCH设置为0,因为当PCH空闲时也可以做为AGCH来用. 
不同的PCH信道可以用于不同的寻呼组进行寻呼,组合信道寻呼组会减少,非组合会增多.寻呼组越多,用户需要等待时间越长.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多