浪潮 | 专访智源研究院院长黄铁军:AI终会取代人脑?

凤凰网科技原创 | AI个体性没那么强,大模型可能是极少数的存在。
点击收听本新闻
听新闻
打开凤凰新闻客户端 提升3倍流畅度

凤凰网科技|出品

主持|刘毓坤

作者|蒋浇

编辑|张涛

核心观点:

1.大模型“智能涌现”要有两个必备条件:一是大模型规模要越来越大;二是需要生成式的模型,生成式模型具有产生无法预测可能性的能力,这种能力是以往不被强调和关注的。

2. 将来大家是在(大模型)服务云上直接获得智力,成本很低。就像买一度电只用花2角钱,现在(大模型)生态还在形成的初期,还不是体系化的生态。

3.万亿模型已经算现在最大参数量的网络了,但万亿跟人脑比,那还是“小巫见大巫”,我们人脑是百万亿连接,最大模型也只有(人脑)1%。

4.从人工智能的发展来说,脑机接口我不认为它是将来一个重要的方面。人工智能是高速系统,它的物质基础是芯片、光电这样的技术。而人是一个基于有机化合物的慢速系统,这俩东西如果要接在一起的话,绝对是不匹配的。

浪潮 | 专访智源研究院院长黄铁军:AI终会取代人脑?

正文:

“AI黄埔军校”,圈外人九成没听过,圈内人尽皆知。

最近,2023年北京智源大会在京成功举办,这可以说是本年度国内规格最高的人工智能盛会。图灵奖得主Geoffrey Hinton、Yann LeCun(杨立昆)、Joseph Sifakis、姚期智、张钹、张宏江、郑南宁等院士共全球200多名全球顶尖人工智能专家齐聚一堂,共话AI。

而刷屏网络的OpenAI创始人Sam Altman中国首讲,让大会彻底出圈。会后几天,许多企业人士和圈外媒体四处打探,主办方北京智源人工智能研究院(以下简称“智源研究院”)是什么来头,为何拥有如此大的号召力?

尽管低调,但这家年轻的机构却是国内大模型的先行者之一。

2020年10月,智源研究院开启超大规模预训练模型“悟道”项目进行训练;2021年3月,“悟道1.0”系列发布,智源对人工智能转入“炼大模型”新阶段的研判,也让“大模型”这一概念进入公众视野;21年6月,悟道2.0发布,该系列模型最大参数达到1.75万亿,是GTP-3的十倍。

本次大会,智源研究院院长黄铁军发布了“悟道3.0”系列大模型及算法,这是目前我国市场上为数不多的可商用开源大语言模型之一。

智源研究院无疑是开源的拥趸者,黄铁军在做客凤凰网科技《浪潮》栏目时表示:“我们做技术的,更希望大家一起来构建一个生态,大家分工不同,可以相互合作。”这恰恰是智源研究院打造悟道系列大模型的愿景,即大模型将是未来AI平台的起点,成为类似“电”的基础设施。

就当前颇具争议的人工智能领域话题,黄铁军与我们畅聊了两个小时,他详细地解读了大模型技术以及国内大模型的发展。他表示,大模型“智能涌现”要有两个必备条件:一是大模型规模要越来越大;二是需要生成式的模型,生成式模型具有产生无法预测可能性的能力,这是人工智能以往不被强调和关注的。

当下,大模型比武成为大厂们争夺声量的方式。黄铁军认为,生成式AI有无限可能,不要用绝对的标准评价它,现阶段应该研究怎么去更好的“涌现”,用技术上来推动千行百业发展。

作为一名类脑人工智能权威科学家,黄铁军谈及“AI是否会替代人脑?”时称,尽管现在大模型参数已经达到万亿规模,但跟人脑比,还是“小巫见大巫”的数量,我们人脑是百万亿连接,也只有人脑的1%,模型还有很大的扩容空间,

但他也认为,“超级人工智能比人类要强、要主导这个世界”是有可能出现的。

(以下为对话实录)

01.大模型“智能涌现”要有两个必备条件

凤凰网科技《浪潮》:黄院长好,您的主要研究方向为视觉信息处理与神经形态计算,也是我国《新一代人工智能发展规划》起草工作的主要参与者之一。那您可以给观众用最简单的语言科普下什么是AI大模型吗?

黄铁军:近年来人工智能发展特别快,大模型可以说最主要、最热门的一个方向。整个人工智能的研究,核心其实就是训练一个模型,那么模型怎么理解呢?

实际上,它是一个人工神经网络。我们人脑其实是一个生物神经网络,人工神经网络是生物神经网络的一个简化。我们刻画一个神经网络的时候,最主要的参数就是它的连接数量,因为神经网络中有神经元,有神经连接的数量。那么我们做一个模型,或者是一个人工神经网络的时候,参数量是相对比较小的,比如说几万、几十万、几百万、几千万、上亿,这就算比较大的了。

但过去五年左右,(人工神经)网络的规模放大得很快,从几亿、几百亿、千亿,到现在万亿的规模。为了描述模型参数不断增大的趋势,我们智源在2021年发布“悟道”模型时,就造了一个中文词叫“大模型”。

凤凰网科技《浪潮》:您刚才说2021年智源就已经提出大模型时代即将要到来,当时是怎样预判到的?

黄铁军:这个道理其实很简单。因为人工智能智能水平的高低,取决于它对这个世界的刻画能力。世界是不断在变化的,有海量的数据来描述这个世界。人工智能模型要有效地表达这个世界,规模就要达到一定的程度,太少的参数是无法表达现实世界的复杂性,所以我们当时就提出了这么一个概念。

大模型本身作为一个产品、一个结果,实际上背后有大量的工作要做,第一个就是数据,没有足够多的数据无法训练出先进的大模型;第二,就是训练本身是需要一个先进的软硬件平台才能实现的,智源这方面也做了很多工作;最重要的是算法,我们智源研究院开展这方面工作比较早,也比较系统,当然我想算法并不是任何一个机构所能包揽的,它一定是产、学、研各方面共同协作的一个结果,所以我们在构造开源开放平台方面做了很多工作,这是我们的一个特点。

凤凰网科技《浪潮》:我们提到AI大模型,一定离不开一个词语就是ChatGPT,ChatGPT 的出现,让许多人觉得人工智能已经具备了“涌现”的能力。我们怎么去理解这个“涌现“?从ChatGPT-3.5再到4,您怎样看待当前AI的智能进化能力?

黄铁军:一方面,大模型规模要越来越大。“大”很重要,对于一个复杂系统,特别是像神经网络这样的复杂系统来说,规模不达到一定程度是无法产生新的“涌现”这种可能性,这是一个基本的条件。但还有另外一个特点,特别像ChatGPT这一类模型,我们必须要强调的就是生成式模型,也就是GPT中“G”的含义。

生成式的模型,与以往的人工智能模型有很大的差别。以前,我们说人工智能系统或者人工智能模型的时候,往往是一种叫判别式思维,比如一个图像识别系统、人脸识别系统、语音识别系统,我们考核它的这个能力,主要用正确不正确来做评判标准。比如通过人脸识别考勤,需要的识别率要很高,这就是叫判别式模型。

生成式模型发生了一个根本性的变化,就是一个人工智能模型要具有产生新可能,甚至于无穷无尽的可能性的能力,这种能力是以前不怎么关注和强调的,可以说是“涌现”的一个前提条件。

当然,涌现什么时候出现,在什么条件下出现,现在应该说还是一个开放问题。事实就是它已经涌现,产生了当初没有预测的能力。但怎么产生更好的涌现,这背后还有很多问题要研究。

02.未来大模型智力服务会像电一样便宜

凤凰网科技《浪潮》:现在可以看到国内外的大模型,在语言理解、文本生成等方面表现都很好,但在真正的产业空间里,大模型规模化、标准化应用还需要一段时间。大模型产业化落地方面,主要会面临哪些困难和挑战?

黄铁军:我认为整个人工智能落地现在才刚刚开始,之前的一些人工智能产品,包括图像识别类的产品,包括自动驾驶里、图形处理里用的一些人工智能技术,已经很多了。但总的来说,更多的是一些专门的应用,或者叫“专用人工智能”。

现在已经过了一个转折点,就是人工智能作为通用技术赋能于千行百业已经发生了。任何一个技术,要向各行各业、千家万户都要服务的话,那还是面临很大挑战的。就像刚才讲的电力、互联网,都有一个发展的、部署的过程,会有一个时段要建基础设施,要跟原有的产业体系进行磨合,去替代原有的一些智能,但是这个趋势显然是大的浪潮。

现在面临的挑战,就是经济社会方方面面如何能够快速适应新技术的冲击,以及跟新技术最终融合后形成一个全新的产业体系。

凤凰网科技《浪潮》:现在各方各面的声音都很多。之前有企业家说10月要赶超GPT,也有企业家表示说赶超的都是吹牛。目前有没有国内外公认的标准,能评价大模型的性能优劣?我们到底如何去评判一个大模型?

黄铁军:首先我们要放弃用绝对的标准进行评价,因为它是生成式的人工智能,它可以产生无穷无尽的可能性,我们不能用一把尺子来完全确定下来哪个分更高一点,不能僵化的去评价大模型。

我们智源研究院在做一个评测体系,这是我们国家新一代人工智能重大科技项目的一个旗舰项目,有一整套的评价体系。其实,我们现在有能力,只要发布一个模型允许访问,允许有API访问,我们马上就可以给出体系化的评价指标。但我们做评价不是从商业上去做,我们更多的是要评价技术。我认为现在用哪个模型,哪种模型更好,可能从商业上看各有各的一些考虑。但我认为,最重要的还是训练模型所用的算法和技术。

凤凰网科技《浪潮》:有观点认为目前有大模型而无生态,您怎么看待?

黄铁军:这种说法其实很有道理,AI生态它是体系化,它是个运营化的生态。

电力时代,那些发电的公司就属于供应端。类比到人工智能领域,大模型本身可以类比为发电机。如果只是一个企业在自己商业范围之内用,那跟当年企业造一个发电机或者买一个发电机,没有什么差别。这不是人工智能大模型时代的主要生态。

它主要的生态就是做模型训练,连续不断地训练,这是一端。另外一端,是各行各业千家万户大家去用这个智力,而不是用模型。大家不会买一个模型拿回家去用的,就像刚才举例子,我们都是用电网的电,没有人去买一个发电机给自己发电。

人工智能大模型时代的基本特点也是一样,将来大家是在智力服务的云上直接获得智力,成本很低,就像我买一度电只用花2角钱。现在生态还在形成的初期,我们今天看到的还不是体系化的生态,生态形成还需要一个过程。

凤凰网科技《浪潮》:现在也有声音说,人工智能最终的战场是生态的战场。

黄铁军:因为我是搞技术的,我更倾向说大家联合去构建这么一个生态,这其中有社会分工,有人研发、有人运营、有人做产品、有人做服务,形成一个千万人相互合作的生态。当然,这里边肯定也有竞争,做同类服务有竞争这很正常。大家不要上来就以垄断的思路想大模型就是“我的”,不是那么回事。

03.ChatGPT训练只用了百分之几的中文数据

凤凰网科技《浪潮》:如何看待对于中国大模型发展,中英文数据的质量差别是比较大的瓶颈?我们如何推进更优质、更安全的中文数据?

黄铁军:ChatGPT当初训练时确实是英文数据多,中文数据少。而且据我们了解,他们也用了智源的中文数据集,但他们用的中文数据只有百分之几,所以它英文表现得比中文好,这也是自然而然的。

数据的分布,决定了大模型智能输出特性的不同。中文数据的建设,对于未来大模型发展来说是特别重要的一项工作。1997年,互联网行业刚刚起步,我发表了《警惕我国成为信息盆地》文章,当时全世界都在发展互联网,如果中文的网页网站少了,那就成为“信息盆地”,低洼的地方。

现在训练大模型面临的问题是一样的。如果未来,我们想中文在全球范围的大模型产业体系里能有它该有的地位,那中文数据建设一定要加强的,不光是数量,还有质量。现在大家已经注意到这个问题,而且一定程度上形成了共识,已经开始行动了。

凤凰网科技《浪潮》:ChatGPT带来了革命,也带来了乱象,您怎么看待这种情况?

黄铁军:目前应该说是人工智能的一个突变性的时刻。无论是从研究人员还是到社会公众,其实大家对这样的一个突变可能还没有做好心理准备,所以可能会有很多社会的这种反应。

凤凰网科技《浪潮》:我们怎么去分辨哪些在炒作大模型,哪些是真正有用的?

黄铁军:“大模型驱动”的时代现在还正在形成中,今天的大模型和未来大模型生态之间我们还要走不短的路。大家都知道, ChatGPT最初的数据库截止到2021年的,所以它知道2021年之前的事情。但2021年的事情就不知道了

今天我们讨论的发布大模型,当发布大模型的时,它就已经是个静止的东西了,静止的东西怎么对未来会产生那么大作用呢?如果说大模型的话,它一定是藏在后面的24×7训练服务一套智力服务体系。今天我们说发布一个大模型或者一个大模型产品,某种意义上只是在证明我能做,或者做的模型好不好,还是一种技术能力的展示,不是大模型服务生态。

04.人工智能发展至今,是否可以替代人脑?

凤凰网科技《浪潮》:您之前的论文中也有提到,人类的神经元是有限的,但可以通过研究去开发出“超级大脑”,那现在大模型的出现,是否意味着我们到了这个阶段呢?

黄铁军 :人工智能有很多种技术路线,做神经网络是大家一直在探索研究的。这个过程有波折,有时候大家认为可以不要神经网络,直接用逻辑的方法,还有其他一些方法也可能实现人工智能。但最近,特别是“深度学习”提出以来,应该说用人工神经网络做人工智能,现在成了主要的主流的技术路线。

今天的大模型,包括生成式人工智能都是建立在神经网络基础上。但这样的神经网络和生物神经网络差别还是很大,现在技术手段能实现的还是很粗略、很粗糙的人工神经网络。

我原来讲“超级大脑”,其实涉及两个方面,一是人工神经网络规模上要更大,要接近人类,甚至于比人类要更大,这是一个方向;另外一方向,是从网络信号信息的表达处理机理上也要像生物一样。从规模的角度来说,万亿模型已经算现在最大参数量的网络了。但万亿跟人脑比,那还是“小巫见大巫”,我们人脑是百万亿连接,最大的大模型也只有(人脑)1%,可以说是很小了,后边要扩展的空间很大。

它从信号信息处理机理上跟人脑差别很大,大致来说,现在的人工神经网络相当于一种静态的神经网络。就是收集好语料、图片,再训练出一个参数,这个参数对这些数据隐含结构与关系有一个表达。这时候,我们给它一段文字,它可以做出一个生成或者是预测。这是相对静止的,就像读了书后就可以写文章,但实际上这只是智能生物能力中的一方面。

我们生活在不断变化的时空中,视听觉每时每刻都在感知,要做出实时的判断。而人工神经网络要做到这点,不仅规模要大,还要精密、精细,它的信号信息处理能力要和真正的生物相当才能叫超级大脑。

凤凰网科技《浪潮》:刚才我们提到人工智能有一些局限。现在,有许多人在研究脑机接口,比如说马斯克,他在5月底宣布了脑机接口通过了人体试验。你怎么看他这项研究呢?

黄铁军:就(脑机接口)这项技术来说,它已经研究了几十年,在一些疾病的治疗中发挥作用,这很重要,这个是很有意义的。但从人工智能的发展来说,脑机接口我不认为它是将来一个重要的方面。

这个逻辑很简单。以速度为例,人工智能比人快了不是一点半点,它是要快好多数量级的。现在计算机每秒计算的次数和我们人的计算次数相比,那就是差了百万甚至于更多倍数。所以将来的人工智能系统一定是高速系统,因为它的物质基础是芯片,是光电这样的技术。

而人是一个基于有机化合物的慢速系统,这俩东西如果你要接在一起的话,绝对是不匹配的。

我们的脑是慢速的,如果你接的是一个高速AI,那就像把一个人挂在飞机后边往前跑,一下子就给甩出去了,所以频率根本无法去匹配。当然反过来说,我们将相对慢速的芯片植入系统,用于人的治疗,那另当别论。

凤凰网科技《浪潮》:很多人会担心AI现在的发展,不是成为自己的工具,而是把自己完全取代了。您怎么看待碳基文明和碳基文明的未来呢?

黄铁军:这是一个很复杂的问题。我认为至少在一段时间之内,AI只是取代一些工作,取代一些职业,同时又创造了更多的工作和职业。现阶段,实际上是 “人类和AI系统相结合”的阶段。

“一个超级的人工智能比人类要强,要主导这个世界”这种想象,有很多值得讨论的地方。但我想有什么建议的话,就是大家思考这个问题的时候,可能要稍微把以人类为中心的一些想法尽量剥离掉。这种人工智能系统是不是可以做出来?是否会在一定的历史时期会出现?我们不能排除这种可能性。

智力水平比人类要强的系统是有可能出现的。不用过分担心,有时候担心来源于我们以人类为中心的思维延伸,不用过分担心和炒作。另外一方,面对这种可能性不能完全视而不见,我们要想应对的办法,或者应该思考允不允许这样一个系统出现。

凤凰网科技《浪潮》:有一句话我觉得很深刻,可以作为今天最后一个问题去讨论,就是人类只是人工智能演化的一个阶段,有什么是AI无法替代人类的吗?

黄铁军:AI这个词也才出现大概六七十年的样子,要说人类就是AI的一个阶段,这个不应该这么说。人类本来就是进化的产物,然后发明了AI,然后AI自己在演化发展,它也是个智能系统,人类也是一个智能系统,这两种智能系统可以说目前还有很大差别。人类是一个一个的个体人,几十亿人在地球上,形成了一个复杂的社会系统,按照我们的特点在往前发展。

AI个体性没那么强。以大模型为例,大模型不会有那么多,大模型就是一个可能极少数的存在。

但从智能进化的角度来说,我们从无机物进化出有机物,从简单细胞到复杂的细胞系统,把细胞分化出神经系统,然后形成大脑,形成越来越庞大这样的一个生物进化过程,这是智能水平不断提高的这么一个历史进程。将来智能的发展是不是要永远这么发展下去?那也不一定,没有什么事物应该是永久的、绝对的,它会不会在新的物理的基础上然后更快的演化?

我觉得有很多可能性值得去探索。现在可以不用yes or no来思考。

打开APP阅读更多精彩内容