ARM超大核心/Mali-G78发布：性能暴增_

ARM超大核心/Mali-G78发布：性能暴增

19.3万阅读

昨日晚间，ARM官方正式发布了旗下的Cortex-A78以及Cortex-X1架构，前者定位是大核心，后者则是超大核。

官方称，Cortex-A78适用于5nm工艺，性能提升20%，功耗则降低了50%。

但实际上由于架构和A76/A77同属于Austin微架构，所以实际上A78的IPC性能仅提升了7%，功耗降低了4%，内核小了5%，四核簇面积的缩小了15%。

上文说的20%性能以及50%的功耗更多的是频率以及工艺方面带来的优势。

按照官方说法，7nm生产的Cortex-A77频率可达2.6GHz，而在5nm工艺下A78的频率能够达到3GHz，同功耗下持续性能提升20%左右。

而在相同的性能下，5nm工艺打造的主频2.1GHz的Cortex-A78核心要比7nm工艺打造的主频2.3GHz的Cortex-A77功耗降低50%。

全新的大核在性能提升方面是不是让人有点失望？不要着急，因为ARM还发布了全新的超大核心Cortex-X1。

Cortex-X系列是ARM全新推出的高性能核心架构，首款产品就是Cortex-X1，其性能比A77来说提升了30%，比A78也提升了22%，机器学习能力则提升100%。

此外，Cortex-X1还允许客户进行自定义，打造更多的不同特性，但这需要客户在研发的早期阶段就进行参与。

相比A78来说，Cortex-X1解码带宽从4路提升到5路，增加了25%，NEON浮点从2条128b提升到了4条128b，相当于浮点性能翻倍。

而在缓存方面，Cortex-X1的L1缓存可达64KB，L2缓存1MB，L3缓存可达8MB，达到了Cortex-A78的两倍。

在核心搭配方面，Cortex-X1可以跟Cortex-A78、Cortex-A55来组建三丛集的架构，也就是一颗X1、三颗A78搭配四颗A55，兼顾超大核大核以及小核。

在ARM的官方文档中，这种架构可以搭配1MB L2、8MB L3，组成一套DynamIQ集群。

如果是4个Cortex-A78、搭配4MB L3缓存，其性能比前代升20%，同时核心面积降低15%。而如果是个Cortex-X1、3个Cortex-A78搭配8MB L3缓存的话，虽然核心面积会增加15%，但峰值性能提升了30%。

简单来讲，Cortex-X1的性能提升是非常明显的，但核心面积方面确实要大不少，这也意味着更多的晶体管、更高的成本以及更高的功耗，就看方案厂商们如何取舍了。

在发布Cortex-A78以及Cortex-X1 CPU架构的同时，ARM还发布了全新的旗舰GPU架构Mali-G78以及定位次旗舰的Mali-G68。

Mali-G78可以看作是Mali-G77的续作，依然基于全新的Valhall图形架构，最高可配置24颗核心（G77仅为16核心）。

官方称，在同等工艺条件下，Mali-G78相比G77来说性能可提升15%，能效比提升10%，机器学习性能提升15％。

而综合架构和工艺等方面来看的话，Mali-G78相比于Mali-G77的性能提升幅度可达25％。

此外，Mali-G78在架构方面也有调整，原本G77只有一个全局时钟域，而G78则改为两级结构，实现了异步时钟域，也就是上层共享GPU模块与实际着色器核心频率的分离。

简单来说，这么做的好处就是GPU核心的频率可以和GPU其它部分的频率不同，实现动态调整，从而降低功耗、提高能效。

底层方面，Mali-G78重构了FMA引擎，包括新的乘法架构、新的加法架构、FP32/FP16浮点，执行效率更高，号称可以节省30％的功耗。

而Mali-G68的架构实际上和Mali-G78是一样的，但最多只能配置6个核心。简单来说，配置1-6个核心就叫Mali-G68，配置7-24个核心就叫你Mali-G78，和Mali-G57/G77类似。

打开APP阅读更多精彩内容

打开APP阅读

#中方反制美国“对等关税”

商务部：关税问题的根子在美国，希望美资企业采取务实行动

#全球股市大跌

美国财长将美股崩盘甩锅DeepSeek

#酒店“瞬间涨价”引质疑

20分钟涨了近150元，酒店“瞬间涨价”引质疑

#今日辟谣

内蒙古阿拉善盟医保局：警惕冒充医保工作人员的电话诈骗

#全美掀起“反特朗普”浪潮

美议员承诺30天内弹劾特朗普：我来找你了！