智东西9月6日报道,刚刚华为消费者业务CEO余承东在德国柏林IFA 2019国际电子消费品展览会上正式推出了其首款集成5G通信模块,并采用全新达芬奇架构NPU的手机芯片——麒麟990 5G以及支持4G版的麒麟990。
今天这场发布会备受关注,麒麟9系列芯片是华为手机的旗舰芯片,也是华为每年手机芯片的重中之重,而今年麒麟990又因为集成了5G模块而备受关注。
华为麒麟990这款芯片发布的时间也非常微妙,主会场是在德国IFA 2019发布,但在国内华为设置了第二现场同步发布。
就在麒麟990发布两天前,也就是在9月4号,三星抢先宣布发布其首款内置5G基带芯片的一体化处理器Exynos 980,采用8nm工艺制造。值得注意的是,三星的Exynos 980将在今年年底开始批量生产,2020年可落地到5G终端中。三星这一举动被认为是截胡华为麒麟990。而在两周之后,苹果新一代旗舰手机芯片也即将发布。
麒麟990打出四个首款旗号:
1、业内首款7nm EUV(极紫外光刻)工艺,集成了103亿个晶体管。
2、业内首款旗舰5G NSA &SA 手机SoC。
3、业内首款16核Mali-G76 GPU。
4、业绩首款 大-微架构NPU。
此外,麒麟990在CPU、GPU、NPU、工艺制程、通讯基带、性能、功耗、以及AI模块都有了大幅度的性能升级。
余承东在现场还明确说到,麒麟990芯片将搭载于13天之后即将在德国发布的华为Mate 30系列上。
接下来,让我们详细解读下,麒麟990芯片的四大重要升级。
去年麒麟980首发了7nm工艺制程,此次麒麟990的4G版依然采用了7nm工艺。但麒麟990 5G版的工艺制程则升级为7nm EUV,这也是当下最先进的制造工艺。
虽然麒麟990芯片内集成的晶体管数量,从麒麟980的69亿跃升为103亿,数量增加了上一代的49%。但由于采用新的工艺制程,板级面积最大降低36%,让其尺寸依然保持和上一代一样的14mm*14mm,余承东说比指甲盖还要小一点。
晶体管数量越多意味着芯片的运算速率越快。越小的制程能够带来越强的性能、越低的功耗和散热以及更小的芯片尺寸。因此,制程之间的差异甚至直接影响着两个芯片之间的性能、功耗等参数。
对比一下:华为麒麟980中集成了69亿个晶体管,麒麟970中集成了55亿个;苹果去年推出的A12中集成了69亿个晶体管,A11中则集成了43亿个晶体管。高通的骁龙855则没有透露晶体管数量。
虽然,苹果在去年年底推出的A12X芯片同样采用了7nm制程,集成了100亿个晶体管,但这款芯片仅搭载于iPad Pro上,没有用于手机产品上。
麒麟990全新采用的7nm EUV工艺相比于7nm有哪些优势呢?
EUV(Extreme Ultraviolet Lithography)又称极紫外光刻,是一种采用13.5nm长的极紫外光作为光源的光刻技术。相比于现在主流光刻机用的193nm光源(DUV技术),新的EUV光源能给硅片刻下更小的沟道,从而能实现在芯片上集成更多的晶体管,进而提高芯片性能,继续延续摩尔定律。
随着半导体工艺的发展,芯片晶体管的面积和密度越来越接近物理极限,DUV技术在制造芯片时会产生严重的衍射现象,难以推进着制程工艺的进步,因此EUV技术就成为突破这一瓶颈的关键。
本次发布会最大的亮点之一就是麒麟990集成5G基带,成为了业内首款发布并量产的手机5G SoC芯片。
余承东说,麒麟990的5G模块是真正融入到了麒麟990 5G芯片中,而不是简单地封装到一起,通信模块和CPU、GPU共享着麒麟990的内存。相比于外挂5G基带方案或者简单地封装方案,功耗更低,数据传输速率更快。
在5G通信方面,麒麟990 5G的下行峰值速率达到了2.3Gbps,上行峰值速度达到了1.25Gbps。对于用户来说,几秒钟下载2G内容,顷刻间可以把高清音乐和视频下载完毕。
今年1月24日,华为正式发布5G基带芯片巴龙5000,在Sub-6GHz(低频频段,5G的主用频段)频段实现4.6Gbps,在毫米波(高频频段,5G的扩展频段)频段达6.5Gbps。
针对于外场通信环境的挑战,麒麟990 5G采用带宽分配技术(BWP技术),在轻负载数据下功耗可下降44%,比其他方案功耗优化高了20%。同时,针对两个重点场景高速移动和5G信号覆盖弱的区域,利用AI技术进行了深度优化。
1)针对高速移动场景,麒麟990 5G基于机器学习技术采用了自适应的信号接收机制,加强波形束缚,利用机器学习技术进行信道匹配,让手机在移动过程中,自动选择最佳的5G信道。
余承东说,这一技术在实际测试下,在每小时120公里的运动速率下,5G下行速率可以提升19%。
2)针对5G信号较弱的区域,对于上行要求比较高,麒麟990 5G采用了智能上行分流设计。在接入网NR上行资源受限时,上行速率仍可以提升5.8倍。
在AI性能上,麒麟990相比于上一代也有了重大升级。华为将此次发布会定义为“重构”,其中非常重要的一点就是在NPU上。
余承东说,如果将麒麟970的AI能力定义为1的话,麒麟980的AI能力提升了88%,而麒麟990的AI能力则提升了47%。作出这一解决的数据来源,并非华为自己提供的,而是来自第三方测试机构AI Benchmark。
麒麟990的NPU架构采用了华为自研的达芬奇架构。去年,华为推出达芬奇架构的云端AI芯片昇腾Ascend 910和昇腾Ascend 310,今年6月21日,华为首次将达芬奇架构落地于终端芯片,推出了7nm制程的麒麟810。
此次达芬奇架构落地于麒麟990,则宣告着华为正式在手机旗舰芯片中使用自研达芬奇架构。而此前的两代产品,麒麟980和麒麟970的NPU则采用的是寒武纪的IP核。
麒麟990增加了一个微核NPU设计。麒麟990 5G采用了两个大核NPU+1个微核NPU设计;麒麟990则少了一个大核NPU,采用1大核+1微核的方案。
余承东说,之所以采用这个微核的设计,是因为一些应用对AI算力要求没有那么大,微核的功耗更低。他现场以大车和小车拉货物做比,用大车拉小货物就是浪费资源。
那么微核功耗低到什么程度呢?大核和微核的功耗相差24倍。假如只用微核进行工作,同一部手机下,一天的耗电量还不到手机的5%。
在全新的架构模式下,麒麟990支持300多个算子,比上一代的麒麟980多了近100个。同时,麒麟990还支持了90%的视觉计算神经网络,涵盖了目前所有开源的网络模型,比如VGG、Resnet、VDSR、Deeplab等。
在AI算力的大幅度提升下,麒麟990在应用上也拥有更强大的能力。比如,实时视频多实例分割。也就是说,在开视频的情况下,可以实时针对视频中的人、不同物体进行识别和分割。现场,余承东进行了Demo演示。
<iframe src="https://v.qq.com/txp/iframe/player.html?vid=x0923zck7tr" width="300" height="150" frameborder="0" allowfullscreen="allowfullscreen">
在视频中,用户可以实时改变视频背景,可以将多人中的一个人放到屏幕另一边,或者随意进行缩小和放大,而这些都是在实时状态下实现的。
除了在5G、AI、芯片制程上的升级,麒麟990在CPU、GPU、ISP、闪存规格上都有重要升级。这样让搭载麒麟990的设备,可以拥有更优秀的应用体验。
在基础性能方面,CPU对于SoC性能影响至关重要。手机几乎所有的运算操作都需要依靠一个强大的处理器来支持完成。在跑分测试里,处理器性能也是占据了相当大的一部分比例。影响处理器性能的,一是核心数量,二是核心架构差异。
去年,麒麟980的CPU架构上进行了重大升级,采用2超大核+2大核+4小核共计8核的配置,首发全球首款基于ARM Cortex-A76打造的CPU。
此次麒麟990 5G的CPU此次依然保留了2超大核+2大核+4小核配置,仍基于ARM Cortex-A76和Cortex-A55两款IP核打造,但在频率上有所提升。具体配置如下:2大核(Cortex-A76 Based@2.86GHz)+2中核(Cortex-A76 Based@2.36GHz)+4小核(Cortex-A55@1.95GHz),能效提升分别提升12%、35%、15%。
在图形处理方面,GPU比处理器性能更重要,是直接决定手机能否流畅运行大型游戏的关键因素。决定GPU表现的参数则跟处理器相似,架构和运算单元数量决定其性能。
麒麟990的GPU架构依然采用和麒麟980一样的ARM Mali-G76架构,但核心数从10升级为16核。在核心数大幅度增加下,麒麟990的图像处理能力也有了大幅度提升,性能提升6%,能效提升20%。
在应用体验上,麒麟990还为重载游戏设计了智能缓存技术,面向CPU、GPU和内存之间的通信,可以进一步降低功耗,节省15%带宽。配合着华为软件层面上的Gaming+技术,GPU在游戏时候图像处理更加优秀。
目前手机芯片高度集成,除了传统的CPU、GPU之外,还集成了ISP(图像传感处理器)和DSP(图像处理器芯片)两部分。
在ISP方面,华为也早已具备自研能力,在麒麟990上已经是华为自研的5.0版本。
麒麟990的ISP性能也是非常强大,吞吐率15%,能效15%,照片降噪能力30%,视频降噪20%。同时,麒麟990还支持4K 60帧视频拍摄。
值得一提的是,在麒麟990上,华为首发了两个降噪技术,一个面向图像降噪,一个面向视频降噪。
要知道降噪是图像/视频处理领域很基础、很热门,但也很难的问题,在实际产品中极少见到降噪技术的应用。
BM3D算法是单反相机上非常有名的降噪算法。
其工作原理是,先把图像分成一定大小的块,根据图像块之间的相似性,把具有相似结构的二维图像块组合在一起形成三维数组,然后用联合滤波的方法对这些三维数组进行处理。最后,通过逆变换,把处理后的结果返回到原图像中,从而得到去噪后的图像。
该方法确实有效,拥有较高的信噪比,视觉效果也很好。业内不少研究者提出了很多基于BM3D的去噪方法,比如基于小波变换的BM3D去噪、基于Anscombe变换域BM3D滤波等等。
视频画面中的噪声主要来自两个维度:空间域和时域。
空间域噪声指的是,一帧图像内的噪声,即同一帧内在不同位置上分布的噪声;视频中的噪声在空间域上的表现就是同一时刻不同位置上出现的噪声。
时域噪声指的是,在帧与帧之间的噪声,即不同帧之间同一位置上分布的噪声;视频中噪声在时域上的表现就是同一位置噪声不停的闪烁。
在麒麟990上,华为推出了双域联合视频降噪技术,在空间域的基础上叠加了频域(信号是由哪些单一频率的信号合成的,频域实际上是时域信号进行傅立叶变换的数学结果),然后再和时域进行结合。
视频降噪不仅是视频处理一个非常基本也非常实用的问题,不仅涉及到图像/视频处理的基本功底,同时也非常考验算法优化能力及工程实现能力,只有对算法有深刻理解才知道如何优化算法,当然也只有对OpenGL和工程实现有深刻理解才明白如何进行性能优化。
在这一技术的加持下,在应用方面,搭载麒麟990的手机可以探索全新的ISP+AI应用。
<iframe src="https://v.qq.com/txp/iframe/player.html?vid=j0923gf80yx" width="300" height="150" frameborder="0" allowfullscreen="allowfullscreen">
5G到来后,除了对核心CPU处理器的要求提升之外,还对手机存储速度有了更高的要求。打个比方,如果在消防员的高压水枪前面安装了一个奶茶吸管粗的出水口,出水量肯定不够大。5G网络下的快速网络上传和下载能力就像一个猛烈的高压水枪,而手机的存储速度就像前面的出水口。
因此,为了更好地适应5G网络的速度,5G手机必须标配UFS 3.0。UFS 3.0的双通道设计可以最高达到23.2 Gbps的传输带宽。手机从存储中读取内容或写入内容的速度,影响游戏或应用加载的速度或将视频文件复制到存储所需的时间。
麒麟990上支持UFS 3.0和UFS 2.1存储标准,UFS 3.0是迄今为止最新的存储标准,于2018年1月30日发布。
UFS的全称是Universal Flash Storage,是一种设计给予数码相机 、智能电话等消费电子产品使用的通用快闪存储规范,由固态技术协会JEDEC权威发布。UFS 闪存的不同标准,代表着存储技术的不同等级。
按照公开的测试数据,UFS 3.0 闪存(512GB 容量)的顺序读取速度可高达 2100 MB/s、写入速度高达 410 MB/s,随机读速 63K IOPS、写速 68K IOPS,较 UFS 2.1(1TB)分别提升了1.1 倍、0.58 倍、0.09 倍和 0.36 倍。除了能使信息、资料以更快速度读取和写入,UFS 3.0 的功耗也更低。
麒麟990 5G是目前业内实现量产的首款集成5G模块的手机SoC。
从今天麒麟990的发布来看,麒麟990的各项性能指标重新树立了行业标杆,同时,定义了未来一年旗舰手机性能风向。
麒麟990的发布也预示着,手机SoC进入5G集成新时代。接下来,手机芯片行业将进入激烈的你追我赶状态。
两周后即将发布的苹果A13将搭载在新一代iPhone上亮相,从目前释放的消息来看,A13也许不会集成5G模块,但其性能提升依然值得期待。
今年年底高通的新一代手机旗舰芯片骁龙系列将推出新品,在5G芯片上,高通拥有骁龙X50和X55两款产品,X50今年采用外挂形式,已经用在中兴、OPPO、vivo、小米等厂商的5G手机上,而年底的骁龙旗舰芯片是否会集成5G模块,以及会是X50还是X55都备受瞩目。
三星方面,虽然此次抢先华为率先宣布其首款内置5G基带芯片的一体化处理器,但确宣布在今年年底开始批量生产,2020年可落地到5G终端中。因此,三星Exynos 980正式量产出货也将成为行业聚焦点。
此外,已经推出5G基带芯片的联发科和紫光展锐的动作,也将成为产业焦点。
两年前,华为的麒麟970可以说是打出了业内“手机AI芯片”的第一枪,也引发了整个AI芯片行业的讨论。去年麒麟980的发布,更是在架构和性能上再次惊艳众人。
此次,麒麟990带来了更多惊喜,在性能提升的同时,也实打实地让我们看到了AI算力加持下,更多强大的应用得以在终端实现。
众所周知,今年华为遇到了前所未有的坎坷,在芯片研发方面更是遇到了巨大阻碍。不过,今天麒麟990的发布,让我们看到华为依然在世界先进手机SoC的赛道上一路狂奔,狂飙猛进。