今年的诺贝尔奖最让人意外的莫过于物理学奖颁给了AI界的大咖杰弗里·E.辛顿。而后化学奖也如法炮制,颁给了两位在利用人工智能推动蛋白质折叠研究方面做出突出贡献的科学家。
可以合理预测,未来会有越来越多的奖项跟AI有关。
相较“硬核”的科学类奖项,文学奖或许是一个独特的存在。很多人认为,至少在当前,AI的创作水平不太可能跟一流的文学作品相媲美,因而离诺奖还很远。
随着各类生成式AI的能力日益增强,我们不得不承认,生成式AI已经具有一定的创作能力。以下是ChatGPT4.0根据笔者要求写的一篇微型小说:
要求:写一篇跟海洋探险有关的微型小说,包含宗教、战争、爱情元素,200字左右。
回复:
海洋的尽头
在被战争撕裂的小岛上,年轻的渔夫阿尔杰深爱着祭司艾莉亚。岛上流传着传说:只有通过纯洁的爱与牺牲,才能唤醒“海神之石”的力量,带来和平。
阿尔杰决定出海寻找这块神秘的宝藏,希望能帮助村民免受战争摧残。在波涛汹涌中,他终于找到了海神之石,并默念着对艾莉亚的爱。引发了强大的能量,海洋回应了他的心声。
然而,他的船遭遇了敌军,敌舰船长正是艾莉亚的兄弟。他渴望停止战争,却被仇恨蒙蔽。正当他举剑之际,艾莉亚出现,呼喊爱与团结的重要。她的呼唤令兄弟动摇,最终放下武器。
在爱与信仰的力量下,战争的阴影消散,小岛重归和平。阿尔杰与艾莉亚的爱情也在潮汐间得以坚定,追寻希望的彼岸。
可以看出,尽管受字数限制,这篇微型小说的一些细节仍有待进一步展开,但它能够紧扣题目中的关键元素,情节充满曲折,有相当的想象空间。
考虑到生成式AI只是一个聊天机器人,需要人类的提示词唤起,这应该不能算是完全独立的AI创作。当下,我们更加感兴趣的是:AI是否能够增强人类的创造力?换句话说,比起纯粹的人类文学创作,有AI相助的作家创作水平会不会更高一些?高多少?
围绕这一问题,英国伦敦大学学院(UCL)的阿尼尔·多什(Anil R. Doshi)和埃克塞特大学的奥利弗·霍瑟 (Oliver P. Hauser)两位教授开展了一项多达千人参与的大型实验,通过考察生成性AI对人类短篇小说创作的影响,来探究AI与人类创造力的关系。这一实验成果刊登在2024年7月的《科学进展》(Science Advances,Science的姊妹刊)杂志上。
实验分两阶段进行。首先,实验人员在专业创作平台上招募了500名创作志愿者,经一定的标准衡量出他们的创作水平。然后,将合格的参与者随机分配到三种实验环境中:“仅人类(Human-only)”“人类加上一个生成性AI想法(Human with one GenAI idea)”“人类加上五个生成性AI想法(Human with five GenAI ideas)”。
创作者被要求写一个限定八句话的微型故事,主题包括公海、丛林或外太空探险,可以是适合年轻读者的任何内容。除了“仅人类”组外,另两个组的创作者能够从生成式AI创意产出中出现的“微”体裁中获得灵感,包括“微小说”和“微视频”,在简洁中体现创意。
实验最终收集了293个故事,然后进入第二阶段,即评估阶段。
同样,实验人员通过平台招募了600名评估人员,每人随机分配六个故事进行三轮评估。
第一轮是在任何信息披露之前,评估者评估故事的创造力和情感特征。
实验人员将创造力分为新颖性和有用性两个方面:新颖性评估的是一个想法偏离现状或期望的程度,包括新颖性、原创性和稀有性。而有用性反映一个想法的实用性和相关性。特别值得一提的是,评估人员需要判断如果进一步发展,这个短篇故事成为出版物(例如一本书)的可能性。
情感特征主要包括故事的文采、愉悦性、趣味性、无聊度、情节发展预期和曲折性六个方面,评估人员需要对此进行主观评判。
评估者还需评估故事是由人工智能还是人类撰写的可能性,以及得知作者借助了生成式人工智能进行创作之后,对每个故事的作者的版权要求提出意见。
实验结果显示:获得生成式AI想法支持可以使故事更有创意、文采更好、更具愉悦性(见图1,图2)。就新颖性而言,生成式AI提供1个想法的作者比仅人类组作者增加了5.4%,而生成式AI提供5个想法的作者增加了8.1%。其对故事有用性的影响也非常显著。生成式AI提供1个想法的作者比仅人类组作者故事的有用性高3.7%。生成式AI提供5个想法组比仅人类组作者提高了9.0%,比生成式AI提供1个想法组作者提高了5.1%。
🔺图1第三方评估者对创造力的评估,
🔺图2 第三方评估者对情感特征的评估,
进一步区分不同创作能力的作者,研究发现,AI支持的作用在创意水平较低的创作者身上体现得尤其明显。也即,低创作能力者的故事在创造力上的这些进步,使他们与高创作能力的作家不相上下。
这一结果与人们对于生成式AI在其他领域应用情况的印象基本吻合。例如随着生成式AI的发展,它已经能够很好地开展各类设计工作,包括产品、LOGO、广告文案的设计。经验一般的普通设计师如果能善用生成式AI这一工具,其作品完全可以接近或达到资深设计师的水平。
实验人员的另一个重要发现,是使用生成性AI的故事彼此之间的相似度更高,与仅由人类创作的故事相比,集体新颖性降低。其中,获得一个生成式AI想法所增加的相似性为10.7%,AI提供五个想法的相似度增加值为8.9%。
结论是:虽然生成性AI提高了个体的创造力,但可能以牺牲集体新颖性为代价。
这一点类似于囚徒困境。如果从单个人来看,使用生成式AI可以帮助提升创意水平,但是如果大家都用,AI所带来的新颖性的好处就消失了。
类似地,如果单个企业率先利用AI来改善运营、降低成本、提升用户体验,AI就可以为其带来竞争优势。但这种优势很难持续,因为同行们最终都会发现AI的作用,从而积极跟进,采取类似策略,先行者的优势被削弱。
回到AI是否能获文学奖的问题。
一种意见认为AI在文学创作领域,至少有以下三个方面的缺陷,导致它很难产生具有丰富情感世界的文学作品,因而不太可能达到诺奖水平:
一是由于AI不具有肉身,缺乏人生理上的种种感受。它不能感受生理上的快乐和苦痛,也不受欲望的驱动,从而不可能具有人类那样独特的生理和情感体验。
二是AI不是人类成员,没有嵌入复杂的社会网络关系之中,因而不具备人类普遍的社会心理(包括潜意识)。社会性是人的本质属性之一,诸多实验表明,人的行为和决策受社会关系的强大影响。人类做不到对所有人一视同仁,因此在对待人的态度上会有区别,而AI不具备这一特征。
三是AI没有人类丰富的精神世界,从而缺乏反思能力,或者说智慧。人有探求智慧、了解自身的愿望,不仅思考外部世界,更思考内心。人会思考“我是谁?”“人生的意义是什么?”等终极问题,AI不存在一个相对稳定、个性化的自我,反思无从谈起。
概言之,AI是缺乏人性的。举个例子。1994年上映的电影《这个杀手不太冷》(Leon:The Professional)4K修复导演剪辑版上映。这部电影的女主人公娜塔莉·波特曼已经43岁,男主让·雷诺更是年过古稀。
这个电影中令人反复回味的一句话直达人性:
“生活总是这么痛苦,还是只有小时候才这样?”
Is life always this hard or is it just when you are a kid?
“总是如此。”
Always like this.
一定是来自极致的生理和心理感受,动人的作品才能触达人心。
也许,AI与文学有另外结合的方式。与物理学奖类似,实际情况也许不是人与AI的直接比拼,而是如同前面实验所展现的那样:有一个从纯粹人类的创作向人类-AI共创的演化过程。假如某位创作能力中等但对AI非常熟悉的作家巧妙地借助生成式AI的力量,创造出一种全新的叙事风格,达到一流作家的水平,进而问鼎诺奖也是很有可能的。
作者:赵付春 于保平,36氪经授权发布。