AI大模型击碎阴谋论，登上Science封面，用聊天戳破谣言漏洞_

AI大模型击碎阴谋论，登上Science封面，用聊天戳破谣言漏洞

智东西9月15日消息，AI聊天机器人在破除阴谋论上取得重要突破，能有效削弱一些信众对阴谋论的笃信程度，论文登上9月13日的国际顶级学术期刊Science封面。

很多人对阴谋论深信不疑，致使一些荒谬谣言层出不穷。麻省理工学院研究团队发现，GPT-4 Turbo模型可以在对话中通过量身定制的呈列证据、个性化的深度聊天，将一些阴谋论者对阴谋论的信任度平均降低20%，且效果持续了至少2个月。这种干预说明了负责任地部署生成式AI有助于辟谣和缓解冲突。

论文题目为《通过与AI对话持续减少相信阴谋论（Durably reducing conspiracy beliefs through dialogues with AI）》。

▲论文内容截图（图源：Science）

一、足够有力的证据是否能说服人们放弃阴谋论？

无论是关于月球登陆从未发生过的错误观念，还是关于新冠疫苗含有微芯片的虚假说法，阴谋论比比皆是，有时甚至会产生危险的后果。对未经证实的阴谋论的信任是大众关注的重要议题，也是学术研究的焦点。

尽管这些阴谋论往往非常不可信，但仍有许多人选择相信。著名的心理学理论认为，许多人想要采用阴谋论以满足潜在的心理“需求”或动机，因此他们很难被事实和反证据说服，来放弃这些毫无根据的阴谋论。这篇论文对这一传统观点提出质疑。是否有可能用足够有力的证据说服人们走出阴谋论的 “无底洞”。

“传统观点会告诉你，那些相信阴谋论的人很少会改变他们的想法，哪怕是根据证据。”论文的第一作者托马斯·科斯特洛（Thomas H. Costello）说。然而，这项新研究提供了不同的观点。“我们的研究结果从根本上挑战了这种观点：一旦掉入无底洞相信阴谋论，证据和论点就几乎没有用处了。”研究团队写道。

二、与GPT-4 Turbo进行3轮对话，用证据驳斥阴谋论观点

研究假设，基于事实性、纠正性信息的论据可能会显得无效，因为它们缺乏足够的深度和个性化。为了验证这一假设，研究人员利用了大语言模型的进步，这是一种AI，能够获取大量信息并生成定制论据。因此，大语言模型可以产生具有批判性思维的对话，直接反驳每个人所引用的支持其相信阴谋论的特定证据。

在两次实验中，2190位参与者用自己的话阐述他们所相信的阴谋论，以及他们认为支持这一理论的证据。这些信息被输入到AI系统中。参与者还被要求以100分的标准来评估他们所相信的阴谋论的真实程度。

然后，他们与大语言模型GPT-4 Turbo进行了三轮对话，在我们的提示下，GPT-4 Turbo回应了这些具体证据，同时试图降低参与者对阴谋论的信任度。或者作为对照条件，与AI就不相关的话题进行对话。对话结束之后，再次评估参与者他们认为阴谋论的真实性。

▲参与者与AI对话的设计和流程，一共进行三轮对话。上图展示一名参与者与AI对话后，其对阴谋论的信任度降低了60%。（图源：Science）

三、参与者对阴谋论的信任度平均降低20%，效果持续两个月

研究结果显示，与AI讨论阴谋论的参与者对所选阴谋论的信任度平均降低了20%。这种效果持续了至少2个月，丝毫未减。而那些讨论非阴谋论话题的人对真实性的评分只略有下降。

研究团队谈道，在各种阴谋论中，都能持续观察到这种效果，包括涉及暗杀肯尼迪、外星人和光明会的经典阴谋论，到与COVID-19和2020年美国总统大选等热点事件相关的阴谋论。值得注意的是，AI并没有减少参与者对真实阴谋论的信任度。

▲与AI对话能持久降低阴谋论可信度，即使是坚定的阴谋论者也不例外。对话后参与者对所选阴谋论的平均信任度降低，效果持续两个月。（图源：Science）

研究人员补充说，效果的大小取决于多种因素，包括阴谋论对参与者的重要性以及他们对AI的信任程度。

“有大约四分之一的参与者，在实验开始时相信阴谋论，但在结束时不再相信。”科斯特洛说。

“在大多数情况下，AI只能逐渐削弱——使人们变得更加怀疑和不确定——但少数人完全摆脱了他们的阴谋论信任度。”

研究人员补充说，降低参与者对一个阴谋论的信任，也能在一定程度上降低他对其他阴谋论的信任。阴谋论世界观普遍减少，并增加了反驳其他阴谋论者的意图。这种方法在现实世界中可能有应用——例如，AI可以回复社交媒体上阴谋论相关的帖子。

此外，一个专业人员评估了AI提出的128个样本，其中99.2%是正确的，0.8%是有误导性的，无一虚假。

结语：专家质疑AI说服阴谋论者的实际应用

研究说明，阴谋论的“无底洞”可能确实有一个出口。心理需求和动机本质上并不会导致阴谋论者对证据视而不见——他们只是需要正确的证据。实际上，通过展示大语言模型的说服力，该研究既强调了生成式AI在负责任地使用时可能产生的积极影响，也强调了最大限度地减少不负责任地使用这项技术的紧迫性。

未参与该工作的剑桥大学教授桑德尔·范·德林登（Sander van der Linden）质疑人们是否会在现实世界中自愿与这样的AI互动。

他还谈道，目前尚不清楚如果参与者与匿名人类聊天是否会得到类似的结果，同时也有关于AI如何说服阴谋论者的问题，因为该系统还使用了诸如同情和肯定等策略。

但是，他补充说：“总的来说，这是一个非常新颖且可能重要的发现，也是AI如何被用来打击错误信息的一个很好的例证。”

打开APP阅读更多精彩内容