江南官方体育网页版·架构设计脱胎换骨!英特尔酷睿Ultra深度解析

2024-05-15 08:01:29 1 来源:江南官方体育app 作者:江南综合体育app下载安装

江南官方体育网页版·

  2023年12月15日,英特尔正式发布了第一代酷睿Ultra处理器平台,也就是首个基于Intel 4制程工艺(7nm)打造的移动级处理器平台,其核心代号为Meteor Lake,产品系列贴标设计也采用了全新方案。

  同时在命名方面也不再使用酷睿i3、i5、i7,而是采用酷睿Ultra 3、5、7+三位数字+H的命名,如酷睿Ultra 7 155H。

  酷睿Ultra家族首发包含了28W的H系列以及15W的U系列,前者包含酷睿Ultra 7和Ultra 5的四款产品,分别采用16核22线线GHz睿频加速。后者同样是酷睿Ultra 7和Ultra 5各两款产品,均采用12核14线GHz。

  相对于以往的酷睿平台处理器,全新的酷睿Ultra可以说是全面革新。新的制程工艺、新的架构设计、新的功能特性等等,可以说是与以往的酷睿处理器有着非常显著的区别。

  得益于整体制程、架构的变化,英特尔酷睿Ultra平台也拥有了不少全新特性,如基于Foveros 3D封装技术的高性能混合架构,模块化的计算单元等等。

  同时它还升级了英特尔锐炫GPU,支持低功耗AI加速的NPU模块等等。接下来通过本篇文章,让我们一起认识英特尔酷睿Ultra。

  Meteor Lake采用了全新的分离式模块设计,使整个平台更加灵活,并能够同时适应高性能计算和低功耗长续航需求。

  Meteor Lake包含了GPU图形模块、SOC模块、CPU计算模块以及I/O模块,架构图如下:

  位于最左侧的是GPU图形模块,它采用了基于XeLPG架构打造的Intel ARC锐炫核显,性能较此前锐矩Xe核显提升2倍,并且支持DX12 Ultimate。

  Meteor Lake的GPU优化了缓存互连,拥有8个GPU核心,128个Vector Engines(矢量引擎),几何图形渲染管线大幅提升,并且新增了8个硬件光追单元,新增了乱序采样功能,进一步增加准确率和性能。

  从英特尔锐炫核显的相关特性来看,其基本集成了高性能独显的所有核心特性,如对于DX12U的支持,对于AV1编解码的支持,对于DP4A人工智能加速引擎的支持,以及Intel XeSS的支持。

  根据官方测试数来看,英特尔锐炫核显在性能方面较锐炬Xe核显提升2倍,以下是多款主流游戏的提升百分比。如新近热门的《博德之门3》提到100%,《生化危机8》、《骑马与砍杀2》两款游戏提升幅度都达到了90%以上。

  可以看到越新的游戏提升幅度越大,这是因为英特尔锐炫GPU的驱动更新一直对新游戏提供Day 0级支持,因此做到了非常好的新游戏适配。

  而与锐龙平台的Radeon 780M集显对比的线p中等画质,锐炫核显平均有着16%左右的提升。

  此外得益于Intel XeSS技术的加持,锐炫核显能够进一步提升游戏画面流畅度,平均提升幅度达到了39%。这意味着轻薄本也能玩3A游戏了。

  位于中间的是SOC模块,其中包含了全新的低功率计算岛E-core,内置NPU AI加速引擎,支持Wi-Fi 6E和Wi-Fi 7,支持8K HDR和AV1格式编码的媒体引擎,支持原生HDMI2.1和DP2.1标准的显示单元,并且集成了内存。

  位于右下角的是计算模块,也就是我们熟悉的P-core和E-core,这次的性能核与能效核均采用全新的Intel 4制程工艺打造,并且优化了电源管理和总线带宽。

  具体到E-core与P-core的变化,首先,酷睿Ultra平台的E-core微架构由Gracemont升级到了Crestmont,确保在低功耗下进一步提升E-core的吞吐能力。同时,其VNNI指令集的执行也得到大幅提升,因而增强了AI计算能力。

  以酷睿Ultra 7 165H为例,它的单线程性能和多线%,在功耗进一步降低的情况下,总体表现还是相当让人满意的。

  位于左下角的是I/O模块,这里主要集成了Thunderbolt4和PCIe5.0,提供出色的连接性。

  在拆分成四大模块之后,图形、计算和I/O模块其实都是大家比较熟悉的,但SOC模块可以说是Meteor Lake最为与众不同的地方。

  以往,Wi-Fi、媒体引擎、显示以及内存等都分布于不同IP之中。如媒体引擎以往是在GPU图形单元之中。

  而Meteor Lake在基于性能与能效比的考量上,将这些统一集成到了SOC模块中。其在架构设计上遵循了四个原则:

  第一,对计算的密集型IP进行了重新划分,以实现其功率的优化。力求在不影响性能的情况下,大幅提高能效比。

  第二,对I/O进行了扩展,使SOC内部所有主要IP都能享受到带宽支持,所以提供了非常大的系统内存相匹配的带宽。

  还是以媒体引擎为例。以往,媒体引擎集成在GPU单元中,所以只要媒体引擎在工作,实际上就是整个GPU单元在工作。而GPU在工作的同时,又需要访问内存,因此还要把环形总线打开,这样就会使能耗变高。

  而Meteor Lake将媒体引擎与图形单元拆分,并集成到低功耗SOC中之后,用户在使用媒体引擎相关应用时,如看视频的时候,GPU模块就不需要被打开了。

  同时内存也放到了SOC总线上,此时即便需要访问内存,几个模块也不需要打开,这样就可以节省功耗,延长电脑的续航能力。此外像I/O模块也是同样的原理。

  SOC模块除了集成以往的Wi-Fi、媒体引擎、显示以及内存之外,NPU和低功率岛E-core可以说是两个全新的单元。

  NPU是英特尔首款低功耗推理专用的人工智能引擎,在CPU与GPU之外,英特尔希望通过拥有更好能效比的NPU去实现对人工智能的不同维度的加速能力。

  它可以看作是PC普及人工智能的一个标志。在Meteor Lake平台上,如背景虚化、追踪、眼角度矫正等基于AI的特性将被放到功耗更低的NPU上去执行,这样可以极大程度降低CPU与GPU的使用,从而让笔记本具有更好的续航能力。

  NPU支持标准化程序界面,支持商业以及开源API,从而为人工智能应用开发提供了非常友好的开发界面。

  具体到架构层面,NPU主要集成了两个神经计算引擎,它由推理管道和可编程数字信号处理器构成,具备高效灵活的矩阵乘法和卷积,支持激活函数以及数据转换。

  其内置两个MAC阵列,专门负责矩阵乘法和卷积,支持最佳数据重用,以降低功耗,支持INT8和FP16数据类型。

  同时拥有单独的激活函数和数据转换模块。此外,它还集成了DMA引擎和暂用内存,可将数据引入软件管理的SRAM,图形编译器会优化调度DMA任务,并支持先进的数据重新布局。

  此外,借助OpenVINO等工具,以及对于AI应用、大模型库的支持,NPU在AI相关应用,如Stable Diffusion等方面,都能提供非常出色的性能支持。

  NPU使得Meteor Lake整体能效提升多达8倍,它推动了生态系统创新的标准化编程接口,Meteor Lake处理器全系列均支持NPU。

  低功耗岛,顾名思义,它的诉求就是在追求极致性能的前提下去降低能耗,延长电池使用时间,让系统变得更冷更安静。

  将低工作负载应用直接运行在SOC模块的低功耗E-core上,如Wi-Fi、NPU AI推理、流媒体播放等,可以实现让用户在运行低负载任务时只需要SOC去工作就可以了。

  而当一些重负载任务运行是,如游戏等,模块才会按需打。