蓝色的舞台上,正中间立着一块黑色的面板,面板上蓝色的扁圆形屏幕正在闪动,后面传出冷静而理性的女声。
而右侧的讲台上,一位西装革履的小哥正在聆听这个面板的“演讲”,时而动笔记录,时而面色凝重,时而嘴角露出邪魅一笑,看起来信心满满,胸有成竹。
这是IBM的AI与人类冠军辩手的对决,也是今年Think 2019大会的一个环节。
人机大战的一方是IBM的的AI,Project Debater,那块黑色面板就是它在人间的载体。去年6月,它击败了2016以色列全国辩论冠军Noa Ovadia,创下了AI在辩论方面击败人类的历史记录。
△ 左为Project Debater,右为哈利什
另一方则是2012年欧洲辩论冠军哈利什·纳塔拉(Harish Natarajan),一位牛津本、剑桥硕的学霸,本科主修政治、哲学、经济(PPE)专业,因此他也是英国前首相卡梅伦的学弟;硕士则在研究哲学和国际关系;现在则是AKE咨询公司的经济风险主管。
谁胜谁败?由现场观众的选票决定。
这场辩论的规则比较简单,拿到辩题后,双方各有15分钟的时间进行准备,提出自己的论点和可以反驳对方的论据;
正式开始后,双方各有4分钟的时间进行开场立论,之后各有4分钟时间进行驳论,最后各有2分钟时间进行总结;
而场下的观众评审则是由湾区学校里的顶尖辩手和100多名记者组成,在辩论开始前和开始之后,观众评审们各进行一次投票,选出自己支持的观点,辩论后观点支持人数增加的一方获胜,另一方失败。
直击人机辩论
主持人送出一句“May the best debater win”的祝福,人类辩手出场,Project Debater“站”在台上静静等待。
他们今天的辩题,也算关乎人类的未来,起码关乎下一代:
We should subsidize preschool。
我们应该资助幼儿园。
正方:AI辩手,反方:人类代表哈利什。
AI认为,资助幼儿园这不仅仅是个经济问题,也是道德和政治问题。她的观点可以归结为三个方面:资助幼儿园能帮儿童摆脱贫穷、有助于后续的学业,甚至还能节约医疗开支、降低犯罪率。
从立论陈述到总结陈词,AI都旁征博引:
为了说明高质量幼儿园能让孩子在之后的学业上表现更好,她引用了杜克大学的一项研究;
为了说明幼儿园和犯罪率之间的关系,她拿来新泽西州的案例,还用了好几次“大量研究表明”,列举了不少数据;最后的总结,还用上了人类作文要诀——名人名言。
人类代表哈利什也说,AI提供了丰富的信息,列举了很多事实和数据。
而他的辩论风格和AI截然不同,人类辩手当然不能和一台电脑比拼查资料举例论证的能力。
哈利什选择抓住弱点反驳,再谈现实状况。他抓住的弱点,是AI反复论证的“拯救贫穷”,谈的显示状况,是政府的钱是有限的,投资了幼儿园就要耽误其他方面。
他说,投资幼儿园帮不了最贫穷的人,而是那些本来无论如何也要送孩子去幼儿园的中产。而“良好的幼儿园”带来的那些好处,一来只是推论,二来也不是穷人能享受得到的。
所以,还不如花在更实在的地方。
这场辩论充满反差感。AI动之以情,讲人文关怀和人类尊严;人类晓之以理,谈政府要认清现实精打细算。
在驳论环节的最后,AI甚至还学会了“升华”。她(对,官方给定义了性别)说:资助幼儿园事关basic human decency,人类基本尊严。
在围观了整个过程的量子位看来,“人类基本尊严”由黑色面板背后的冷静女声说出来,现场观众大概不会有什么共鸣。AI虽然打着感情牌,整体辩论风格却是充满英美老牌报刊的气息,如同托福高分作文一般,讲论点列论据。
而人类代表抑扬顿挫,有一丝丝网络论坛上流传的阴谋论味道:别听她的,能得到好处的,还是那群中产!
我们节选了开场环节的视频,来一起领略一下AI与人类的辩论:
最终,旁征博引谈人类尊严的AI还是输给了抓住漏洞狠狠攻击的人类。
辩论开始前,现场79%的观众支持投资幼儿园,而20分钟辩论过后的第二轮投票,支持者只剩下62%。
人类冠军说服了17%的观众。
best debater,属于人类代表哈利什。
主持人在公布结果、恭喜人类辩手时,甚至一度口误,把“congratulations to him”说成了“to them”。
“带路党”哈利什
虽然取得了本场人机大战的胜利,哈利什却是个AI带路党。他认为在不久的将来,AI的辩论水平总会比人强。
在赛后采访中,他说,AI根据论点来引用论据、统计数据的能力让他印象深刻,Project Debater如果和人类的能力结合起来,潜力巨大。
哈利什认为,相比象棋、围棋、星际2这些项目,机器想在辩论上赢过人类要难得多。在辩论赛中取胜,需要三个条件:
一,辩手需要巨大的信息量支持,并将这些信息组成支持己方观点的论点;
二,辩手必须将复杂的论点用清晰、有条理的方式讲出来;
三,辩手需要让观众认同这些论点至关重要。
也就是说,整个辩论的过程中,辩手需要谨慎的发言,表达情感,使用修辞,恰当举例。机器很容易在第一点中胜过人类,它可以方便的获取大量信息,并组成论点;但第二点和第三点对机器来说非常具有挑战性。
虽然难度很大,不过哈利什还是觉得未来会有AI在这三个方面都能超越人类。
AI是怎么辩论的
辩论,需要收集信息、形成结构化论点、再用精确的语言表达出来,要清晰,要有说服力。
面对现场辩论中的陌生辩题,Project Debater需要几分钟的时间来做准备。
整个过程,从搜寻资料开始。她会为了立论陈述从语料库中搜寻有用的短文本,找出几百条相关的片段。
下一步,就是根据这些片段,构建出强力、丰富的论据,来支撑要谈的观点。移除冗余信息,选择最强的语句和证据,根据主题把它们组织起来,构成叙述的基础。
几分钟时间准备好4分钟立论陈述之后,Project Debater还要听取对手发言,准备驳论。
这个过程无论是对人类来说,还是对机器来说都很难。作为一个AI,Project Debater需要识别对手的论点和论据,寻找论点论据来回应它们。
和人类冠军面对面的Project Debater,从2014年就开始为此准备了。
它自带一个庞大的知识库,从报纸杂志摘录了100亿个句子,还具备理解和生成语言的能力,还用知识图谱来寻找辩题背后隐含的悖论。
从项目开始到现在,Project Debater团队发表了30多篇论文,还开放了一个数据集。
花这么长时间培养一个会辩论的AI,有什么用?IBM说,它可以帮网上各种论坛、评论区的辩论变得更文明更有营养,还能帮律师准备庭审资料,甚至能在金融领域辅助投资决策。
负责说话的那个女声,更是可以用到各种各样的领域。
离开爸爸保护的AI辩手
去年六月的那场辩论赛,人类高手输给了Project Debater。
不过,当时的观众评审是一群自带利益相关体质的IBM研究员,也就是Project Debater的爸爸。
比赛进行了两场,第一场是Project Debater对战2016年以色列全国辩论冠军Noa Ovadia,讨论“我们是否应当资助太空探索”,Project Debater为正方,Noa Ovadia为反方。
第二场则是Project Debater对战另一位以色列辩论专家Dan Zafrir,讨论“我们是否应当更多的使用远程医疗”,依然是Project Debater正方,人类反方。
当时的两场辩论赛中,Project Debater的语言表达相对生硬,但传递出的信息量更大,Project Debater说服的观众更多一些——当然,负责投票的观众们是Project Debater的“爸爸”,毕竟是自家儿子,投票的时候也可能偏心了。
传送门
关于Project Debater的论文合辑
https://www.research.ibm.com/artificial-intelligence/project-debater/research.html—完—