华为机器视觉段爱国:四大战略,点亮智能世界 | AI 安防峰会

2020年9月5日,由雷锋网 & AI 掘金志主办的第三届中国人工智能安防峰会,在杭州正式召开。

本届峰会以「洗牌结束,格局重构」为主题,会上代表未来新十年的15家企业,为现场1000余位听众和线上几十万观众,分享迎接安防新十年的经营理念与技术应用方法论。

在下午场的演讲环节上,华为机器视觉总裁段爱国为峰会带来了开场报告。

段爱国提出,一个真正的智能世界有三个非常典型的特征或者基础框架技术:一是万物感知,二是万物互联,三是万物智能。

在华为来看,万物互联、5G、光网络是华为一直以来深耕的领域,华为机器视觉将成为万物感知的入口。

段爱国还认为,智能世界向前迈进有三大核心技术:以全息感知为核心的机器视觉,以万物互联为基础的移动无线通信,以及万物智能的AI技术,2020年这三个技术开始融合。

所以华为在2020年率先提出,所有的视频技术应该从给人看向给机器看转移,并正式把产品线更名为“机器视觉”,聚焦打造两个核心能力:一是前端的全息感知能力,二是在后端用数据驱动,反作用于物理世界,驱动于智能世界。

4G时代,以智能手机为核心,出现了各种行业移动互联网的应用。在华为看来,机器视觉就是5G时代行业数字化的智能手机。段爱国还提到,过去5年,AI的成本在下降,AI已经进入到普惠的时代,他预测未来两年智能摄像机一定会超过网络摄像机。

另外,华为将聚焦打造4个核心战略产品和平台:前端的软件定义摄像机,后端的智能视频存储,类似于智能手机应用市场的智能算法应用商城,以及华为机器视觉云服务。

在此基础上提出四大战略策略:战略一,积极投入全栈全场景的AI研究;战略二,重构产业架构,加速智能化升级;战略三,平台+生态,赋能千行百业;战略四:端边云协同,深度数据挖掘。

最后他强调,会将开放进行到底,未来的智能世界很复杂,华为不可能包揽全部的工作,希望大家一同成长。

以下是段爱国演讲全文,雷锋网AI掘金志作了不改变原意的整理与编辑:

上午很多的专家主要从技术的角度阐述对AI以及对整个智慧安防未来发展的一些看法,我本人不是以技术见长,我更多是从产业的角度来阐述华为对行业未来的理解,我今天的演讲题目是《华为HoloSens,点亮智能世界》。

谈到智能世界,大家都不陌生,我们把千行百业的数字化转型从两个维度展开:

一是智能化的水平,二是整个行业智能化所处的阶段。

在通信、媒资、银行等领域,数字化转型已经进入量级阶段,我们现在所熟知的公共安全、数字政府、教育、机场等等,现在也正处在数字化的爆发期。

还有很多领域,比如医疗、建筑、矿业和农牧业,现在还在起步期,总的来讲,各行各业都在朝着智能化发展。

去年华为的战略研究部门发布了2025年智能世界十大趋势预测,里面很多词大家已经比较熟悉了,有的词可能对安防行业还有点陌生。

在华为看来,未来五年是智能世界快速发展的五年,我们的展望中,14%的家庭将拥有家庭机器人,90%的人将拥有个人智能终端助理,自动驾驶将要上路,机器人将代替普通人,人机协创等都会加速到来。5G就更不用说了,全球的数字治理成为全人类面临的新的大挑战。

华为看到的不仅仅是未来5年智能世界的趋势,我们还汇集了未来智能世界的基本愿景和框架。

在华为来看,一个真正的智能世界有三个非常典型的特征或者基础框架技术:

一是万物感知。

我们认为所有的行业都会充分地数字化、智能化以及边缘计算化,当然,包括今天上午强调的安全,华为也同样重视。

二是万物互联。

这是华为的传统强项,无论是5G、全光网还是全IP网络,都是华为的优势。在华为来看,未来联接将有四个典型特点:宽、广、多、深。

三是万物智能。

同行业各位伙伴讲的更多的是数字孪生,它是物理世界的镜像,通过数字来感知物理世界。

华为认为未来数字世界不仅仅是物理世界的镜像,它也将会是一个独立的世界,让精神世界更加富足。

所以,在华为未来的智能世界中,我们有一个全方位、多角度的愿景和框架。

华为大概在2017年战略投入做智能安防,今年年初改名叫“机器视觉”,我在一些活动中经常被媒体问说华为为什么要做安防、为什么做机器视觉,我也想借此机会和大家分享一下。

在华为看来,万物互联、5G、光网络是华为深耕的领域,华为机器视觉将成为华为在万物感知领域的核心,所以华为做机器视觉其实是沿着华为智能世界愿景而做出的战略部署。

正因如此,2018年,华为迈过30岁门槛的时候,华为刷新了整个公司的愿景。

过去30年,华为的愿景是“丰富人们的沟通和生活”,立足点是从沟通、联接、通信的角度来驱动整个华为公司向前迈进。

未来30年,华为公司的愿景是“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”。

回想我们国家的战略部署,新基建成为全行业的热门词,新基建也是运用网络化、数字化、智能化等技术,支撑千行百业的数字化转型、智能化升级和融合化创新。

在我国面向2025年的新型基础设施的战略规划里,5G、物联网、云计算、人工智能等等都成为关键的投资要点,这就说明新基建的目的就是为未来的智能世界打下一个扎实的数字化的基座,这和华为的愿景也是高度趋同的。

站在华为的机器视觉角度,2020年是非常不平凡的一年,为什么这么说?

我们认为智能世界向前迈进有三大核心技术:

以全息感知为核心的机器视觉,以万物互联为基础的移动无线通信,以及万物智能的AI技术。

这三类核心技术在过去几十年里都经历了不同程度的发展,同时我们很高兴地看到,在2020年这三个核心技术都迎来一个高速发展的契机,而且三个技术开始融合。

比如,移动通信技术基本上是每10年一代,2G、3G、4G,2020年是5G规模商用的元年,也就是说未来的十年是5G蓬勃发展的十年。

我们再看人工智能,AI技术从上世纪50年代提出到目前为止,至少经历了两个波峰和波谷,随着人脸识别、行为识别等技术的发展,尤其在我国,相应的人工智能技术从今年开始真正走向规模的商用。

我听了上午很多嘉宾的分享,从我们以前谈到的技术创新、工程创新到今年真正谈的已经是千行百业的智能化升级和产业升级,所以2020年对人工智能、对华为机器视觉同样如此。

以前我们的视频技术更多是给人看,在清晰度、部署灵活性等方面,都存在很多的约束。华为也是在2020年率先提出,所有的视频技术应该从给人看向给机器看转移,所以我们也正式把产品线更名为“机器视觉”。

我们认为从2020年往后的十年,5G、AI、机器视觉融合下,人类将进入一个全新的超级视野的时代。

华为眼中的技术科学发展,尤其是近几十年的发展,首先是以无线通信技术为核心带来的整个产业的升级。

回看过去十年,4G时代最大的新物种是智能手机,它带来了人和人的联接,引爆了移动互联网。

以智能手机为核心,出现了购物软件、打车平台、地图查询等各种行业移动互联网应用。

今年我们站在5G的元年,往前看十年,未来十年将是机器视觉作为感知入口的物联网的十年,它的核心就是驱动行业数字化。

所以,这句话在我们公司内部达成了高度一致:

过去十年,华为抓住了4G时代,成功从一个ICT公司成为了拥有消费者业务的公司,未来十年,华为将紧紧抓住5G时代,打造机器视觉,抢占万物感知入口,真正引爆行业数字化。

在华为看来,机器视觉就是5G时代行业数字化的智能手机。

既然我们把智能世界、机器视觉放在这样一个高度,华为认为未来智能化发展有两大问题需要解决:

一是智能深化,亟需理论和新范式突破瓶颈。

过去十年,我们解决了深度学习和数据标注的问题,未来十年,在深度学习遇到瓶颈,千行百业的智能化创新不断深化后,业内要持续在三个领域进行创新和突破:

1.理论的突破。深度学习不仅仅是做感知,还要做认知。

2.技术创新。要进行新范式下的视觉研究,具体来讲包括弱标注和无标注的深度学习,以及新模型和多模态的模型突破,还有算力节约的模型研究。

3.工程创新。在监督学习上进行延长。

那么,我们的智能一定会从安防走向各个终端,走向自动驾驶,走向医疗,走向千行百业。

二是智能惠普,进入1T算力起步的时代。

往回看五年,我们发现安防AI成本在逐年快速下降,AI已经逐步进入到一个普惠的时代。

可以看到过去五年,目标识别单路价格已经大幅度下降,变成之前的十分之一,这一系列价格下降也得益于底层算力价格下降,其实算力的平均价格下降幅度更大,远超十倍,所以AI已经不贵,算力也不贵。

所以华为大胆展望,未来两年,智能摄像机一定会超过网络摄像机。

没有记错的话,大概七八年前,当国内主要还是功能机,大家都在谈智能手机很贵的时候,我在瑞士买了第一台智能手机,那时候我和国内同学讲,虽然智能手机很贵,但是很好用,将来会大爆炸。

后来千元智能手机出现了,连我的爸妈都要求用智能手机,一直到现在,几乎看不到非智能手机了。所以我们认为在摄像机行业,未来两年也会出现这样一个转折点,整个行业都会进入到普惠AI时代,1T算力将成为整个行业的起步配置。

上半部分给大家分享了华为未来智能世界的愿景以及我们对智能世界的一些理解,所以我们今年年初改名叫“机器视觉”,我们也聚焦打造两个核心能力:

一是前端的全息感知能力,二是后端用数据驱动,反作用于物理世界的数据智能治理能力,这个理解和整个行业是一样的。

从现在开始往未来3-5年看,华为机器视觉会坚定地拥抱超级视野,也就是坚定地拥抱5G、人工智能等技术,不断拓展AI的广度和深度。

我们将聚焦打造的4个核心产品和平台分别是:

前端的软件定义摄像机、后端的智能视频存储、类似于智能手机应用市场的智能算法应用商城,以及华为机器视觉云服务。这就是我们未来3-5年会持续耕耘的4大核心战略产品。

在这个战略下,今天具体分享的是我们将在4个方面的投入:

战略一,积极投入全栈全场景的AI研究。

华为的全栈全场景是什么意思?就是从AI芯片到算法、算子开发的工具框架,到整个端、边、云上独立和协同的训练算法框架,以及全流程的应用使能服务上,华为将进行全栈全场景的战略投入。

华为在“全栈、全场景”的AI战略牵引下,将持续投资计算视觉、自然语言处理、决策推理等领域的基础研究,积极面向全球建设开放生态,加强人才培养和内部效率提升。

把AI思维和技术引入现有产品和服务,打造面向云、边缘和端等全场景的、独立的、协同的全栈解决方案,提供充裕、经济的算力资源,简单高效的全流程AI平台。

过去几年,华为在算法上的宣传并不多,甚至我有时候碰到一些客户伙伴,他们也会问华为是否做算法。在这里我分享一下,华为在算法应用上可能做得不多,因为我们更多地是通过“平台+生态”的战略去拥抱所有算法厂家,建立算法生态。

不过我们有超过2000人在进行AI相关的算法研究和开发,并持续在AI算法领域投入。

战略二,重构产业架构,加速智能化升级。

1、华为希望通过重新定义技术架构,让硬件和算法解耦,构建开放式的平台。

前端摄像机软件定义(HoloSens SDC),算法按需加载,让通用摄像机秒变专用摄像机。

后端智能视频存储(HoloSens IVS),以全云架构,多算法融合,打通数据孤岛,实现算力、算法、数据和任务协同。

2、一站式智能视频算法商城HoloSens Store,重新定义生态模式

让使用者按需选择,经济适用,让开发者专注需求,快速迭代,实现使用者和开发者双向沟通,让交易得以远程、在线、一站式完成。

下面我具体讲解下这个战略。

前端方面,第一,软件定义的摄像机内置专业AI芯片,最高端的X系列算力是4T,部分款型比如AI超微光卡口摄像机总共有20T算力。

第二,我们有开放的OS,它和手机安卓以及现在华为打造的鸿蒙操作系统一样,未来这个OS也是鸿蒙的一部分。因此,华为所有前端的硬件都可以通过开放的OS进行底层硬件和上层算法应用的解耦。

第三,我们致力于打造丰富的生态,让行业里所有的玩家都可以和华为一起成长。

今年,我们发布了几款具有标志性的摄像机,包括全场景的5G摄像机,基于终端产业链进行创新的“二郎神”双模球机,20T算力的AI超微光卡口,以及生态型摄像机,这都是我们在前端打造差异化产品的一些尝试。

在后端,我们有智能视频云HoloSensIVS,也是像智能手机一样打造生态系统,只不过这个系统是云联接的、集群的大联网架构。

比如,最近打造的一个边缘交通盒子有20T算力,支持开放的生态,厂家的算法只要满足我们SDK或SPI的接入方式,都可以进入这个平台,我们叫做多算法仓。

通过这样的方式,我们可以为各行各业打造“总部+分支”的中心边缘的大联网的架构,我们把它叫“全网一片云”,这也是我们在云化架构上的一些尝试。

另外,我特别想强调的是HoloSens Store智能安防新生态使能平台,我们想打造在AI时代支持算法和应用交易的线上平台,或者说类似于手机的应用市场。

以前传统的客户有各种场景的智能化诉求时,可能会不断找算法,找算法很难,开发者尤其算法的开发者,找用户很难,这个平台支持算法一站式服务,自动地上线,然后自动地下载,自动地交易,一切都可以远程在线云化方式完成。

想象一下,你有一台华为的软件定义摄像机,你到华为的HoloSens商城上去下载算法,它的使用体验和你现在用手机到应用市场下载一个APP的使用体验基本完全一致,这就是我们正在打造的生态平台。

所以我们希望在中间打造一个交易平台,服务使能开发者和用户,通过这种方式真正让开发者和用户直接握手。

战略三,平台+生态,赋能千行百业。

华为会始终坚持开放,安防行业为什么要谈开放?举个例子,在功能手机时代,确实没有生态可言,买一个诺基亚手机,所有的东西都由诺基亚提供。但是到了智能时代,一个厂商不可能做所有的应用,绝大多数都是依赖伙伴。

正是因为我们有了智能手机的实践,所以在智能世界我们坚定地拥抱开放。

具体来说,我们的平台+生态是怎么做的?

主要通过“算法+应用”和“生态仓+传感器”方式。华为机器视觉产品,无论是摄像机、视频存储,还是算法和应用商城均面向产业开放,以华为最新发布的“生态型摄像机”为例,AIoT生态仓架构设计,实现“算法”和“硬件”双开放,进一步实现全息感知,为千行百业赋能打下坚实的基础。

我简单介绍一下两个标志性的产品:

第一,HoloSens Store,华为机器视觉的智能算法应用商城。

目前,我们已经有70多个算法可以在线交易、在线下载,200家严选的算法入驻,客观来讲,我们对算法质量要求非常高,算法上到华为的商城,还有很多的测试和验证。

另外,我们有中国130多家AI算法合作伙伴,目前已经有几万次的算法下载和应用。

HoloSens Store应该是安防行业的一些创新和尝试,我看今年有些友商也在做类似的尝试,这非常好,就像智能手机一样,一定是有多个应用市场,才能真正让算法深入千行百业。

第二,生态型摄像机。

除了算法和应用开放以外,华为在生态上也是开放的。

在华为做AIoT这么多年中发现了很多问题,其中一个是AIoT的回传和连接,为此我们在无线网络上做了很多创新,但是难度很大,商业模式也不够清晰。

基于此,我们认为既然要做万物感知或者全息感知,机器视觉其实是眼睛,我们一定要把耳朵、鼻子、皮肤等都集成起来。

今年5月份华为发布了一个生态型摄像机,它典型的特点是除了具备传统摄像机的功能外,还有生态仓功能,它自带各类有线、无线的接口,让生态伙伴自己在摄像机里开发生态主板,来接入各个厂家的传感器。

那么,我们可以把水位、浊度、溶解氧以及各行各业的传感器都接入到我们的软件定义生态型摄像机,然后由后台进行统一的数据处理、数据分析和数据呈现。如此一来,华为的生态型摄像机就真正把硬件的生态打开了。

战略四,端边云协同,深挖数据价值。

华为在机器视觉领域会坚定地拥抱端边云,我们在端侧、边侧、云侧都有较强的技术投入和布局,通过前端的智能感知、分支边缘存储,基于华为云进行深入的智能分析。

和传统的云厂商不同,我们在端侧和边侧更加注重充分挖掘多维数据。

比如,以前交通路口有不同的设备,分别采集不同的数据,但是这些数据分别传到不同的系统进行处理,数据非常碎片化。

华为看到了这个痛点,聚焦打造了一个智慧交通方案,我们叫做全息路口,通过在路口部署摄像机、雷达,同时在路侧边缘部署ITS800,把视频的感知数据和雷达的感知数据进行拟合。

在这个方案中,华为全息路口能够感知5类源数据,包含了车牌、车速、车的位置、车的属性以及车的行驶姿态等等,进行全方位的感知,同时产生40多种在后端进行交通治理的数字应用。

在华为全息路口的使能下,数据就不仅仅是单维度的,不仅仅是单元的,而是多元和多维度的,是真正把数据做到了全域、全量和全时的数据挖掘。

在全息路口基础上,加上端、边、云的协同,我们就能在交通治理和安全防范上发挥以前发挥不到的价值。

我们最近在全国大概30多个项目里进行了相关的测试和部署,目前都认为这是划时代的变革,真正做到数据的全息汇聚。

当然,华为机器视觉不仅仅是一家技术公司,也是要赋能千行百业的,所以我们今年选定了10大行业来进行相关的产品和解决方案推广,目前来讲进展也不错。

最后,感谢大家的聆听,希望这30分钟的时间能够让大家很好地理解华为智能世界的愿景,以及华为机器视觉四大战略方向。

打开APP阅读更多精彩内容