6月14日,百度数字人度晓晓与龚俊数字人联合演唱的《每分 每秒 每天》歌曲MV刷屏全网,这是国内首个虚拟偶像AIGC(AI generated content,人工智能创造内容)歌曲,从作词到编曲均由AI“操刀”。“每分每秒每天,我都在这里;等着你,来邀请,我随时给你回应……”正如歌中唱到的,作为国内首个可交互虚拟偶像,度晓晓能够在百度APP中为用户提供全程AI陪聊功能,升级搜索体验。这背后是文心大模型提供的强大底层能力。
“用户直接在百度APP通过搜索框或底部语音按钮发起聊天类需求,即可召唤负一楼的度晓晓或者龚俊数字人进行实时对话”,度晓晓产品负责人表示,目前百度的AI数字人主要可以实现四大功能,即个性化聊天陪伴、辅助搜索、服务分发和互动玩法。
百度AI数字人在与用户的对话中,会结合语境,围绕自身“人设”进行相关回复,实现多轮对话,且支持文本、音频、图片、表情包等多样化的聊天形式;当识别出用户搜索信息的意图时,AI数字人将直接回复答案或呈现百度APP内相关问题的搜索结果;当用户表达出看电影、订车票等服务类需求时,AI数字人将为用户跳转至相应服务界面;另外,还可实现讲故事、讲笑话、讲土味情话等娱乐互动功能。
度晓晓可以实现自然的多轮聊天互动,并在对话中识别用户的搜索、服务类需求,这背后是文心大模型提供的强大底层技术支持。具体来说,是全球首个基于隐空间的生成式开放域对话大模型文心PLATO。
文心PLATO是百度研发的具有大规模参数的中英文对话预训练生成模型,经历多次升级,现已升级到百亿参数的文心PLATO版本,在开放域对话效果上得到了持续的提升。基于文心PLATO的对话技术在国际权威对话竞赛DSTC9和DSTC10上共夺得11项世界冠军,具备接近真人水平的多轮聊天能力,模型在对话合理性、丰富度、吸引度等各项指标上均达到了世界领先水平。
接近真人水平的多轮流畅对话是如何实现的呢?文心PLATO首先需要通过在大规模对话语料上预训练对话大模型,来学习通用的对话生成能力;再通过融合画像信息,在预训练对话模型的基础上进一步学习不同画像信息下的对话生成能力,使模型具备人设定制化能力和答复保持人设一致性的能力;最后通过问答生成任务和预训练对话任务进行连续预训练,将海量的问答知识内化到模型参数中,使文心PLATO具备准确的知识问答能力,实现知识增强。
文心PLATO在度晓晓等数字人上的应用,给用户带来了智能流畅的对话体验,在情感陪伴、知识问答等多个方面显现了价值。在文心PLATO的助力下,度晓晓在回复趣味性、上下文关联性、知识准确性、一致性等方面,都达到了新的高度,可与人类进行有逻辑、有内容、有趣的、接近真人水平的深入对话。这也是百度APP从搜索工具向服务窗口的生态转变,百度借助度晓晓看见用户搜索背后的隐藏需求,并通过AI能力,拉近了用户与服务之间的距离。
在文心大模型的支持下,百度数字人“智商”更高,“情商”也更高了,拥有文心大模型能力的AI数字人全面进驻百度APP,一方面意味着对话交互式搜索新时代的到来,另一方面也是大模型支持下AIGC能力逐渐成熟的体现。
近几年,AI技术高速升级迭代,AIGC的实力愈加直观地在大众面前显现。今年6月以来,基于文心大模型的百度数字人度晓晓,写作、绘画、写歌能力密集展示,并纷纷获得高度评价。
在刚刚过去的高考,度晓晓作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》的议论文,在40秒时间里创作了40多篇文章,随机抽取的一篇文章获得了高考语文名师打出的48分,写作水平超过75%左右的高考考生。近日,度晓晓又带着她的画作“现身”西安美术学院2022年“时空留痕·无界西美”本科毕业展,开设专属展区,被美院教授评价为 “已经达到了本科美术生的基本要求”。
作为人工智能“基础设施”的一部分,预训练大模型拓宽了人工智能技术落地场景的覆盖广度,同时降低了渗透到产业应用的难度。除了AIGC方向,目前文心大模型已应用于百度信息流、智能音箱等互联网产品,同时在工业、能源、教育、金融、通信等行业的智能化转型升级中落地。
百度已于近期全新推出文心大模型创意社区——文心·旸谷社区,希望可以让更多用户零距离感受文心大模型的魅力和应用创新潜力。未来,基于文心大模型的AIGC将会带来更多新的创新性探索,并开放赋能到更多的领域。