江南官方体育网页版·
2023年12月15日,英特尔正式发布了第一代酷睿Ultra处理器平台,也就是首个基于Intel 4制程工艺(7nm)打造的移动级处理器平台,其核心代号为Meteor Lake,产品系列贴标设计也采用了全新方案。
同时在命名方面也不再使用酷睿i3、i5、i7,而是采用酷睿Ultra 3、5、7+三位数字+H的命名,如酷睿Ultra 7 155H。
酷睿Ultra家族首发包含了28W的H系列以及15W的U系列,前者包含酷睿Ultra 7和Ultra 5的四款产品,分别采用16核22线线GHz睿频加速。后者同样是酷睿Ultra 7和Ultra 5各两款产品,均采用12核14线GHz。
相对于以往的酷睿平台处理器,全新的酷睿Ultra可以说是全面革新。新的制程工艺、新的架构设计、新的功能特性等等,可以说是与以往的酷睿处理器有着非常显著的区别。
得益于整体制程、架构的变化,英特尔酷睿Ultra平台也拥有了不少全新特性,如基于Foveros 3D封装技术的高性能混合架构,模块化的计算单元等等。
同时它还升级了英特尔锐炫GPU,支持低功耗AI加速的NPU模块等等。接下来通过本篇文章,让我们一起认识英特尔酷睿Ultra。
Meteor Lake采用了全新的分离式模块设计,使整个平台更加灵活,并能够同时适应高性能计算和低功耗长续航需求。
Meteor Lake包含了GPU图形模块、SOC模块、CPU计算模块以及I/O模块,架构图如下:
位于最左侧的是GPU图形模块,它采用了基于XeLPG架构打造的Intel ARC锐炫核显,性能较此前锐矩Xe核显提升2倍,并且支持DX12 Ultimate。
Meteor Lake的GPU优化了缓存互连,拥有8个GPU核心,128个Vector Engines(矢量引擎),几何图形渲染管线大幅提升,并且新增了8个硬件光追单元,新增了乱序采样功能,进一步增加准确率和性能。
从英特尔锐炫核显的相关特性来看,其基本集成了高性能独显的所有核心特性,如对于DX12U的支持,对于AV1编解码的支持,对于DP4A人工智能加速引擎的支持,以及Intel XeSS的支持。
根据官方测试数来看,英特尔锐炫核显在性能方面较锐炬Xe核显提升2倍,以下是多款主流游戏的提升百分比。如新近热门的《博德之门3》提到100%,《生化危机8》、《骑马与砍杀2》两款游戏提升幅度都达到了90%以上。
可以看到越新的游戏提升幅度越大,这是因为英特尔锐炫GPU的驱动更新一直对新游戏提供Day 0级支持,因此做到了非常好的新游戏适配。
而与锐龙平台的Radeon 780M集显对比的线p中等画质,锐炫核显平均有着16%左右的提升。
此外得益于Intel XeSS技术的加持,锐炫核显能够进一步提升游戏画面流畅度,平均提升幅度达到了39%。这意味着轻薄本也能玩3A游戏了。
位于中间的是SOC模块,其中包含了全新的低功率计算岛E-core,内置NPU AI加速引擎,支持Wi-Fi 6E和Wi-Fi 7,支持8K HDR和AV1格式编码的媒体引擎,支持原生HDMI2.1和DP2.1标准的显示单元,并且集成了内存。
位于右下角的是计算模块,也就是我们熟悉的P-core和E-core,这次的性能核与能效核均采用全新的Intel 4制程工艺打造,并且优化了电源管理和总线带宽。
具体到E-core与P-core的变化,首先,酷睿Ultra平台的E-core微架构由Gracemont升级到了Crestmont,确保在低功耗下进一步提升E-core的吞吐能力。同时,其VNNI指令集的执行也得到大幅提升,因而增强了AI计算能力。
以酷睿Ultra 7 165H为例,它的单线程性能和多线%,在功耗进一步降低的情况下,总体表现还是相当让人满意的。
位于左下角的是I/O模块,这里主要集成了Thunderbolt4和PCIe5.0,提供出色的连接性。
在拆分成四大模块之后,图形、计算和I/O模块其实都是大家比较熟悉的,但SOC模块可以说是Meteor Lake最为与众不同的地方。
以往,Wi-Fi、媒体引擎、显示以及内存等都分布于不同IP之中。如媒体引擎以往是在GPU图形单元之中。
而Meteor Lake在基于性能与能效比的考量上,将这些统一集成到了SOC模块中。其在架构设计上遵循了四个原则:
第一,对计算的密集型IP进行了重新划分,以实现其功率的优化。力求在不影响性能的情况下,大幅提高能效比。
第二,对I/O进行了扩展,使SOC内部所有主要IP都能享受到带宽支持,所以提供了非常大的系统内存相匹配的带宽。
还是以媒体引擎为例。以往,媒体引擎集成在GPU单元中,所以只要媒体引擎在工作,实际上就是整个GPU单元在工作。而GPU在工作的同时,又需要访问内存,因此还要把环形总线打开,这样就会使能耗变高。
而Meteor Lake将媒体引擎与图形单元拆分,并集成到低功耗SOC中之后,用户在使用媒体引擎相关应用时,如看视频的时候,GPU模块就不需要被打开了。
同时内存也放到了SOC总线上,此时即便需要访问内存,几个模块也不需要打开,这样就可以节省功耗,延长电脑的续航能力。此外像I/O模块也是同样的原理。
SOC模块除了集成以往的Wi-Fi、媒体引擎、显示以及内存之外,NPU和低功率岛E-core可以说是两个全新的单元。
NPU是英特尔首款低功耗推理专用的人工智能引擎,在CPU与GPU之外,英特尔希望通过拥有更好能效比的NPU去实现对人工智能的不同维度的加速能力。
它可以看作是PC普及人工智能的一个标志。在Meteor Lake平台上,如背景虚化、追踪、眼角度矫正等基于AI的特性将被放到功耗更低的NPU上去执行,这样可以极大程度降低CPU与GPU的使用,从而让笔记本具有更好的续航能力。
NPU支持标准化程序界面,支持商业以及开源API,从而为人工智能应用开发提供了非常友好的开发界面。
具体到架构层面,NPU主要集成了两个神经计算引擎,它由推理管道和可编程数字信号处理器构成,具备高效灵活的矩阵乘法和卷积,支持激活函数以及数据转换。
其内置两个MAC阵列,专门负责矩阵乘法和卷积,支持最佳数据重用,以降低功耗,支持INT8和FP16数据类型。
同时拥有单独的激活函数和数据转换模块。此外,它还集成了DMA引擎和暂用内存,可将数据引入软件管理的SRAM,图形编译器会优化调度DMA任务,并支持先进的数据重新布局。
此外,借助OpenVINO等工具,以及对于AI应用、大模型库的支持,NPU在AI相关应用,如Stable Diffusion等方面,都能提供非常出色的性能支持。
NPU使得Meteor Lake整体能效提升多达8倍,它推动了生态系统创新的标准化编程接口,Meteor Lake处理器全系列均支持NPU。
低功耗岛,顾名思义,它的诉求就是在追求极致性能的前提下去降低能耗,延长电池使用时间,让系统变得更冷更安静。
将低工作负载应用直接运行在SOC模块的低功耗E-core上,如Wi-Fi、NPU AI推理、流媒体播放等,可以实现让用户在运行低负载任务时只需要SOC去工作就可以了。
而当一些重负载任务运行是,如游戏等,模块才会按需打。
05-12
青州市丰盛机械有限公司确认参展 2024山东春季临
青州市丰盛机械有限公司座落于历史文化名城—古九州及花卉之都一青州,地理位置优越,北临济青高速,南
05-12
南兴股份2023年年度董事会经营评述
板式家具机械源自德国、意大利等世界先进制造国家,发展时间长,行业中的代表性国际品牌包括德国 HO
05-12
专访研赛黄总:以技术内驱 解决行业痛点
新品不是终点是起点,量产不是结局是开局。保持稳定的新品推出率,并加大投入研发是深圳研赛自动化设备
05-12
2024中国深圳工业自动化展及机器人展
感谢您使用CNENA平台参展参观!每年都有海量企业从这里走向全国展会现场!如果您正在寻求展会参加