云知声副总裁李霄寒:面向物联网的 AI 芯片的设计与思考

10 月 24 日,2018 ARM 技术研讨会在北京成功召开。

人工智能与物联网技术和应用在过去几年飞速发展,诞生了大量的创新,为人们的生活和工作带来了前所未有的体验和可能性。当前我们正在历经一个以人工智能和物联网为核心的全新科技浪潮,它将在不久的未来见证数以万亿计的智能设备的互联。 ARM 作为全球内唯一一个能够覆盖从端到云的计算架构,将在万亿智能物联时代扮演赋能者角色。

10 月24 日,2018 ARM 技术研讨会在北京成功召开。今年的大会主题为“ ARM 助力创新科技”,会上ARM 公司相关负责人介绍了其从嵌入式、汽车电子到基础架构、服务器等横跨整个智能物联领域的最新技术动态。作为ARM 重要的生态合作伙伴,云知声副总裁李霄寒博士受邀出席大会并发表《面向物联网的AI 芯片的设计与思考》主题演讲。

云知声和ARM 有诸多合作的地方,今年五月云知声正式推出基于ARM 通用核的全球首款面向物联网的AI芯片——UniOne。本次研讨会现场,李霄寒博士结合云知声公司实际情况向在场行业人士详细解读了UniOne 芯片的设计思路,以及芯片系统方案特点,同时探讨了物联网AI 芯片的未来应用及发展趋势。

云知声的物联网AI 落地历程

作为国内顶级的语音方案供应商,云知声从2012 年创始至今,一直致力于将人与机器的语音交互能力从晦涩的机器算法,逐步封装成可以调用的产品,并且落地到大众消费的场景中。

云知声创造过不少行业先例,包括推出国内首家免费的语音云平台、首个实现IVM (智能硬件模组)在白电领域大规模出货的AI 公司、国内首家提出医疗语音系统解方案并拥有最多合作医院的公司,以及发布首款面向物联网的AI 系列芯片UniOne 。

李霄寒博士用“从算法到芯片”概括了云知声公司的发展历程。2012 年-2013年,云知声创立之初,移动互联网方兴未艾之际,云知声主要通过纯软件方案(如语音助手APP )向行业提供服务;2014 年-2015 年,伴随物联网的兴起及发展,其对于AI 的需求逐渐显现,云知声开始探索基于通用芯片面向物联网和行业的软硬件一体化方案,在此期间公司正式确立了“云端芯”的产品及商业战略。2016年,云知声AI 芯片1.0版本—— IVM  模组在格力空调产品上量产出货,医疗产品正式登陆北京协和医院。随后,搭载云知声技术方案的产品陆续在车载、教育、机器人等诸多领域落地。

李霄寒透露,面向不同行业提供服务,一方面打磨了云知声的技术能力,同时也让团队更加深入地了解场景。更为重要的是,在服务不同客户的过程中,建设了云知声的芯片设计能力,让云知声坚定了自主设计AI 芯片,基于专有芯片面向物联网行业提供服务的决心。

从IVM 到基于ARM 核的AI 芯片

人机交互系统的更迭引发新一轮产业变革,语音已成为设备交互的最有效和最自然的方式。李霄寒指出,物联网终端设备对于语音、图像等本体交互具有天然需求,这是云知声选择从语音切入物联网的根本原因。他认为,要实现物联网的智能化改造,意味着设备必须具备“感知、表达、思考”三个关键能力。

以智能音箱为例,首先它需要通过声源定位、远场降噪、唤醒/识别、本地识别、云端识别,听懂人声蕴藏的信息。在感知的基础上,进而通过语音、图像或其他形象化的方式将内容或信息传达给用户。不仅于此,设备仍需通过“云”深入理解用户意图,并结合多终端信息融合和决策、知识图谱以及云端能力,将用户需要的内容和信息通过恰当的渠道反馈给用户。

而要让物联网终端设备具备“感知、表达、思考”三方面基础能力,则必须有硬件载体。李霄寒介绍道,在UniOne 芯片推出之前,云知声主要是基于通用芯片以模组(IVM)的方式来为家居、机器人等行业客户服务。 IVM 是一个多芯片方案,上面必须运行专用的DSP 以解决降噪的问题,另需配备专门芯片来实现语音识别、唤醒等功能,方案臃肿且成本高企。李霄寒指出, IVM 虽然量产后的实际反馈不错,但对于业务的长足发展形成了巨大挑战,具体表现在以下几方面:

1. 边缘算力需求

物联网终端设备的语音交互过程中,当所有的计算被放到云端时,声学计算的部分将对云端计算造成较大压力,容易造成云平台成本的增加和计算延迟。与此同时,在如家电、车载、NB-IoT 等诸多特殊场景下,人机交互完全可在无网状态完成。以智能音箱为例,在真正的物联网场景下,它需要精准判断用户下达的是如问“天气、听音乐”等需要联网支持的指令,还是像“打开空调、增加温度”等可在本地完成的需求。因此,不论从客户体验,还是成本控制等方面出发,都要求在设备端实现“边缘计算”能力。

2. 成本的挑战

在硬件尤其是家电行业,有一个流行的说法,“成本每增加1 块钱,用户需要多花5 块钱买单”。对于以冰箱、空调等产品而言,如搭载云知声IVM 方案,要消化掉因智能化升级的方案成本,则产品售价有可能需要增加500-1000 元,对于大众消费价格段的产品而言根本无法实现,也因此IVM 只能覆盖小部分高端产品。因此,如果想从金字塔尖下沉到更多的产品上,必须解决成本问题。

3. 功耗的挑战

不同的硬件设备尤其是白电产品有着严格的国家及企业级功耗标准,低功耗不仅是芯片制造的事,更涉及场景、应用、算法。 IVM 模组的方式臃肿的架构,无法在功耗方面做到最优,绝非最佳选择。

“基于从业务层面所看到的挑战,以及对势于未来趋的预判,2015 年云知声正式踏上造芯之路。”李霄寒表示。

云知声UniOne 芯片采用ARM 核心,同时自行设计了DeepNet 和uDSP 等专为深度神经网络和适量计算加速的硬件单元。相较于通用芯片,在DSP 任务加速、miniNLP 任务加速、TTS 任务加速、内存带宽利用效率、NN 任务提升等核心指标,都能带来成倍数的提升。

李霄寒指出,之所以选择ARM ,是因为后者拥有非常全面、成熟的IP ,可以满足云知声这类初创公司对于性能、功耗、成本的极致平衡;其次,云知声在AI 芯片设计之初便确定了开源的模式,即除核心引擎之外,其他应用层均可供产品商、方案商灵活设计,这就需要有非常好的开发生态, ARM 无疑最佳选择。

新局面下物联网AI 芯片的挑战与机遇

研讨会上,当谈及物联网AI 芯片当下的面临的挑战时,李霄寒指出,物联网AI 芯片的边缘侧相关软硬件基础架构正在走向标准化,具体表现为网络模型标准化、 IR 标准化、IP 同质化。他认为,物联网AI 芯片主流应用场景所需要的网络模型已经阶段性稳定,IP 的演化路径将逐渐走向固化;其次, NNVM,ONNX 等不同模型在编译链的支持下可以运行在同样的架构上,IR 的标准化意味着行业分工的完成; MAC(计算单元)的堆叠成为计算密度提升的主流手段,当前计算密度的提升对芯片产品尤其是系统的差异化影响日渐式微,标志着精细化耕作势在必行。

他认为,上述的挑战将会给AI 芯片公司带来一定程度的困扰,但挑战的同时也意味着更多的机遇。他预测, AI 芯片创业公司未来的竞争将主要集中在系统层面,即基于对于不同场景的理解之上,从提供单一的AI 芯片,到提供完整的AI 解决方案。

打开APP阅读更多精彩内容