昨日晚间,ARM官方正式发布了旗下的Cortex-A78以及Cortex-X1架构,前者定位是大核心,后者则是超大核。
官方称,Cortex-A78适用于5nm工艺,性能提升20%,功耗则降低了50%。
但实际上由于架构和A76/A77同属于Austin微架构,所以实际上A78的IPC性能仅提升了7%,功耗降低了4%,内核小了5%,四核簇面积的缩小了15%。
上文说的20%性能以及50%的功耗更多的是频率以及工艺方面带来的优势。
按照官方说法,7nm生产的Cortex-A77频率可达2.6GHz,而在5nm工艺下A78的频率能够达到3GHz,同功耗下持续性能提升20%左右。
而在相同的性能下,5nm工艺打造的主频2.1GHz的Cortex-A78核心要比7nm工艺打造的主频2.3GHz的Cortex-A77功耗降低50%。
全新的大核在性能提升方面是不是让人有点失望?不要着急,因为ARM还发布了全新的超大核心Cortex-X1。
Cortex-X系列是ARM全新推出的高性能核心架构,首款产品就是Cortex-X1,其性能比A77来说提升了30%,比A78也提升了22%,机器学习能力则提升100%。
此外,Cortex-X1还允许客户进行自定义,打造更多的不同特性,但这需要客户在研发的早期阶段就进行参与。
相比A78来说,Cortex-X1解码带宽从4路提升到5路,增加了25%,NEON浮点从2条128b提升到了4条128b,相当于浮点性能翻倍。
而在缓存方面,Cortex-X1的L1缓存可达64KB,L2缓存1MB,L3缓存可达8MB,达到了Cortex-A78的两倍。
在核心搭配方面,Cortex-X1可以跟Cortex-A78、Cortex-A55来组建三丛集的架构,也就是一颗X1、三颗A78搭配四颗A55,兼顾超大核大核以及小核。
在ARM的官方文档中,这种架构可以搭配1MB L2、8MB L3,组成一套DynamIQ集群。
如果是4个Cortex-A78、搭配4MB L3缓存,其性能比前代升20%,同时核心面积降低15%。而如果是个Cortex-X1、3个Cortex-A78搭配8MB L3缓存的话,虽然核心面积会增加15%,但峰值性能提升了30%。
简单来讲,Cortex-X1的性能提升是非常明显的,但核心面积方面确实要大不少,这也意味着更多的晶体管、更高的成本以及更高的功耗,就看方案厂商们如何取舍了。
在发布Cortex-A78以及Cortex-X1 CPU架构的同时,ARM还发布了全新的旗舰GPU架构Mali-G78以及定位次旗舰的Mali-G68。
Mali-G78可以看作是Mali-G77的续作,依然基于全新的Valhall图形架构,最高可配置24颗核心(G77仅为16核心)。
官方称,在同等工艺条件下,Mali-G78相比G77来说性能可提升15%,能效比提升10%,机器学习性能提升15%。
而综合架构和工艺等方面来看的话,Mali-G78相比于Mali-G77的性能提升幅度可达25%。
此外,Mali-G78在架构方面也有调整,原本G77只有一个全局时钟域,而G78则改为两级结构,实现了异步时钟域,也就是上层共享GPU模块与实际着色器核心频率的分离。
简单来说,这么做的好处就是GPU核心的频率可以和GPU其它部分的频率不同,实现动态调整,从而降低功耗、提高能效。
底层方面,Mali-G78重构了FMA引擎,包括新的乘法架构、新的加法架构、FP32/FP16浮点,执行效率更高,号称可以节省30%的功耗。
而Mali-G68的架构实际上和Mali-G78是一样的,但最多只能配置6个核心。简单来说,配置1-6个核心就叫Mali-G68,配置7-24个核心就叫你Mali-G78,和Mali-G57/G77类似。