2025 Arm Unlocked AI技术峰会深圳站直击:告别Cortex!Lumex CSS平台携SME2技术重塑AI终端算力格局

2025年10月30日,在活力四射的深圳,全球科技界的目光再次聚焦于此。继上海、首尔站之后,Arm再度隆重举办了“Arm Unlocked 2025 AI技术峰会”深圳站。在面对持续增长的人工智能 (AI) 算力需求,Arm 正持续推进“平台优先”战略,在高性能、高能效及高可扩展性的底层计算架构基础上,携手产业各方共建从云到端的 AI 计算平台。

太平洋科技此次也受邀来到活动现场,为大家带来现场、立体和一手报道。本次峰会共设有四大主题分论坛。在消费电子设备技术专场演讲上,Arm介绍了近期宣布的重磅消息:其面向终端市场的CPU将告别沿用已久的“Cortex”命名体系,转而启用全新的命名规则,并隆重推出了专为智能终端打造的“Lumex CSS”平台。

这一变革不仅仅是品牌策略的焕新,更标志着Arm在AI时代下,其核心战略正从传统的IP授权,向着提供高度集成、AI优先的“计算子系统”(Compute Subsystem, CSS)以及更加一体化的“计算平台”(Compute Platform)交付模式进行转型。

所谓CSS意思是将Arm最新的CPU、GPU以及相关的系统IP(如互连总线、内存控制器)预先集成、配置并验证好,打包成一个完整的高性能平台。对于芯片设计公司而言,直接采用CSS方案,就无需从零开始进行复杂的IP集成和验证工作。这能极大地缩短SoC的开发周期,降低研发风险,帮助合作伙伴更快地将搭载最新技术的产品推向市场。

Lumex CSS平台加持,一个新时代的启航

在10月30日的深圳峰会上,Arm 终端事业部产品管理副总裁 James McNiven首先为大家介绍了Arm最新发布的Arm Lumex平台以及介绍 Arm 如何为移动设备、PC 等提供新一代性能、图形和智能支持,并分享 Arm 对移动终端市场趋势的深刻洞察。

其中Arm Lumex平台是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能 (AI) 体验的先进计算平台。除此之外,Arm还提供面向其他市场的Arm CSS,包括Arm Zena CSS面向汽车行业;Arm Niva CSS面向PC市场;Arm Orbis CSS面向物联网和边缘AI;Arm Neoverse CSS面向数据中心和基础设施。

我们本次参与的消费电子设备技术专场主要聚焦于Lumex CSS平台,它致力于驱动消费电子设备“更智能、更高效、更个性化”的升级。它集成了搭载SME2技术的最高性能Arm CPU、Mali GPU及关键系统IP。Arm强调,这一平台化方案,不仅能助力生态伙伴更快地将AI设备推向市场,还将为消费者带来前所未有的丰富体验,包括桌面级的移动游戏、实时多语言翻译、更智能的个人助手以及高度个性化的应用。

性能飞跃!C1-Ultra与Mali G1-Ultra的硬核实力

在过去的近二十年里,“Cortex”这个名字几乎等同于Arm高性能CPU的代名词。从智能手机革命的开端到物联网设备的普及,Cortex系列IP以其卓越的能效比,构建了庞大的移动计算帝国。然而,随着AI时代的全面到来,特别是端侧AI和大语言模型对算力需求的爆炸式增长,原有的IP命名和交付模式已显现出局限性。

因此从Lumex 平台开始,Arm引入了新的产品命名体系。在这个新命名体系下,Lumex平台里面的CPU系列会以Arm C1-Ultra、C1-Premium、C1-Pro以及C1-Nano等名称出现。James McNiven也在演讲中表示,“如此命名也是为了让整个行业和我们的合作伙伴能够更加一目了然地理解产品定位。”

与此对应,GPU产品线也进行了统一。例如,过去代表顶尖性能的“Immortalis”品牌,现在被统一纳入Lumex体系下的Mali品牌,如最新发布的Mali G1-Ultra。

此次Lumex CSS平台搭载的全新CPU和GPU均基于最新的Armv9.3架构,将Armv9的前沿功能融入端侧AI体验;此外,Arm C1系列CPU还集成了最新的SME2技术,助力CPU性能实现巨大提升。

CPU性能新标杆:C1-Ultra与C1-Pro

作为新旗舰,Arm C1-Ultra CPU被誉为“Arm至今推出的性能最强的CPU”。根据Arm公布的数据,C1-Ultra的单线程峰值性能相较于上一代的旗舰Arm Cortex-X925 CPU,实现了高达25%的惊人提升。这意味着无论是运行复杂的AI模型、处理高分辨率视频,还是执行重度计算任务,C1-Ultra都能提供更强的瞬时爆发力。

与此同时,Arm也兼顾了能效的持续优化。针对功耗敏感型用例(如长时间运行的后台任务或中度负载应用),Arm C1-Pro CPU的能效表现也极为亮眼,在视频播放、网页浏览及社交媒体等用例中,C1-Pro 在同等性能下较 Cortex-A725 的能效提高多达 12%。这确保了设备在提供强大性能的同时,依然能保持出色的续航能力。

除此以外,这次Arm还带来了适用于次旗舰移动设备的Arm C1-Premium核心和适用于可穿戴设备的Arm C1-Nano核心,前者的等面积效率更优,后者更是主打极致能效,厂商们可以根据自身需求灵活调整。

GPU的AI与光追进化:Mali G1-Ultra

在图形处理方面,全新的Mali G1-Ultra GPU同样实现了性能与能效的完美平衡。数据显示,Mali G1-Ultra在实现20%的性能提升的同时,其每帧能耗也降低了9%。这一“增效降耗”的成果,对于追求极致画质和流畅体验的移动游戏而言意义重大。

更值得关注的是其在两个关键领域的突破:

AI推理能力:该GPU在AI与机器学习网络(如神经网络)上的推理速度,比上一代旗舰Immortalis-G925快了整整20%。这使得GPU能更高效地分担AI任务,尤其是在图形渲染与AI计算相结合的场景下(如AI超分辨率、AI HDR等)。

光线追踪性能:Mali G1-Ultra的光线追踪性能实现了两倍的提升。这是移动端图形技术的一个重要里程碑,意味着开发者可以在手机和平板电脑上,实现更逼真、更具沉浸感的光影效果,推动移动游戏画质向PC级和主机级加速靠拢。

另外,James McNiven在媒体采访环节还介绍了即将在明年终端设备中搭载的为下一代移动游戏打造的“Arm Neural Technology”(Arm 神经技术)。该技术利用GPU神经加速器和Vulkan ML扩展,能实现高达50%的GPU工作负载降低!

SME2技术,AI算力的“第二引擎”

如果说C1-Ultra和Mali G1-Ultra是Lumex平台的“坚船利炮”,那么SME2(第二代可伸缩矩阵扩展)技术,就是贯穿整个Lumex CSS平台、赋能AI算力的“灵魂”。

在本次深圳峰会上,Arm终端事业部产品管理副总裁James McNiven还为我们详细介绍了SME2技术的优势所在。他指出,SME2是Arm应对端侧AI爆发的关键技术,它标志着端侧AI开发正迈入一个对开发者更为友好的新时代。

1. 什么是SME2?

SME2是SME(可伸缩矩阵扩展)的新一代版本。在Arm新推出的所有CPU平台(C1-Ultra、C1-Pro等)上都能够使用。相较于第一代,SME2新增了更多的指令集,旨在进一步提升AI处理的性能和能效。

其最核心的升级之一,是支持更小的数据类型——特别是2-bit和4-bit。James McNiven解释道:“随着每年高度量化的模型不断增多,这类小数据类型在移动生态系统中的重要性正日益凸显。”

在2025年的今天,大语言模型正加速在手机等终端上部署。但LLM的庞大体积是其在端侧运行的最大障碍。“量化”——即降低模型参数的位数(如从16-bit降至4-bit或2-bit)——是实现“瘦身”的必要手段。SME2在硬件层面原生支持2-bit和4-bit数据处理,使得CPU在运行这些高度量化的AI模型时,能效可以提升整整三倍,而AI性能提升高达六倍。

2. SME2真的有用吗?

在处理器上有CPU、GPU以及NPU的情况下,SME2的AI算力真的有用吗?

James McNiven的介绍道“SME2 是专为加速矩阵运算和相关负载而设计,非常适合移动设备等对功耗和响应速度要求极高的场景。它能够实现高效的模型压缩与推理,相比 SME1,在性能与能效上都有显著提升。更为关键的是,SME2 能够在低延迟、高实时性的应用场景中展现独特优势。本质上,它使端侧 AI 推理可以直接在 CPU 上完成,从而大幅减少数据在 CPU、NPU 或 GPU 之间的传输延迟。以语音识别为例,这类任务对响应速度要求极高、数据量相对较小,在 CPU 上直接执行不仅能显著提升流畅度,也能更好地发挥 SME2 的实时计算优势。”

3. SME2能带来什么优势?

SME2的另一大核心优势在于其“可编程性”。与功能相对固定的NPU硬件不同,SME2是CPU指令集的一部分,它能灵活适应不断演进的各类AI模型和用例。

更重要的是,SME2解决了开发者的一个核心痛点:即在一些缺乏统一 NPU 标准或异构单元差异过大的移动生态中,启用SME2 技术的CPU 能够成为更可靠的 AI 承载单元。说人话就是开发者可以依赖SME2,确保他们的AI特性能够在尽可能多的设备上高效运行,而无需为不同厂商、不同型号的NPU进行繁琐的适配。

Arm预计,到2030年,SME和SME2将为全球超过30亿台设备,新增超过100亿TOPS的计算能力。毫无疑问,这将是端侧AI能力的一次指数级飞跃。

构建“芯片-软件-工具”端到端平台

上面介绍的都是硬件层面的东西,而想要做好AI,软件层面的生态以及工具也是不可或缺的一环,Arm在这方面也早有布局。Arm正通过其KleidiAI软件库与SME2技术的结合,致力于解决端侧AI算力不足和开发门槛高的两大行业痛点,让强大的AI体验真正落地。

KleidiAI已被集成到多种主流AI框架中,使开发者能充分利用SME2带来的性能优势。例如,在语音识别(ASR)等场景中,优先调用CPU的SME2加速能力可大幅提升AI任务的响应速度。这一技术组合也已在淘宝的搜图购物、支付宝等功能中得到应用,实现了快速的图像识别与匹配。

会后我们也向James McNiven提问KleidiAI与SME2有机会在游戏中应用吗?他给出的回答是:“在游戏方面,我们与腾讯 GiiNEX 在 SME2 上展开合作。腾讯初步测试结果显示,启用 SME2 后性能提升高达 2.5 倍,这非常令人振奋。我们将继续与他们合作,通过 SME2 赋能开发者,构建更丰富的虚拟世界、更智能的非玩家角色 (NPC),以及玩家喜爱的无缝实时体验。未来,我们也期待看到 SME2 在游戏领域中发挥更广泛的应用潜力。”

结语

在2025 Arm Unlocked深圳峰会,我们见证了Arm在后Cortex时代的重大起航。Arm Lumex CSS平台的推出,不仅帮助合作伙伴以更灵活多样的方式构建自身的SoC并缩短其产品上市时间;另一方面还使得开发者和终端用户可以在搭载Lumex CSS平台的终端设备上获得“开箱即用”的超凡体验。同时这也是Arm对AI时代算力挑战的回应,更是其引领行业向“平台化”迈进的宣言。这场变革将深刻影响从旗舰手机到AI PC的每一个角落,而一个由Arm、芯片设计商、终端制造商共同构建的、AI优先的计算新生态,正蓄势待发。

打开APP阅读更多精彩内容