皮笑肉不笑？读取情绪的AI说：我太难了_

皮笑肉不笑？读取情绪的AI说：我太难了

2020/08/26 18:00造就官方账号来自上海市

数以百计的人脸图像出现在屏幕上，一个接着一个。有的眼睛圆睁，有的眉头紧锁，有的开怀大笑，有的抿紧嘴唇。

对于每一张图像，你必须回答一个简单的问题：图片中的人是高兴还是难过？

在这项2018年的研究中，心理学家瑞秋·杰克（Rachael Jack）和同事招募了80人参加这个测试。这个来自英国格拉斯哥大学的研究小组招募了来自西方和东亚的参与者，共同探讨一个长期令人困惑的问题：通过面部表情判断情感真的可靠吗？

几十年来，研究人员探索人们从面部能够感知到什么情绪。美国心理学家保罗·埃克曼（Paul Ekman）在20世纪60年代和70年代进行了颇具影响力的调查，结果显示，世界各地的人们可以从面部表情中可靠地推断出情绪状态——这意味着情感表达是普遍的。

专家曾普遍认为，可以从面部表情中可靠地推断出情绪状态

这一想法在很长一段时间内没有受到挑战。但是，一批新的心理学家和认知科学家正在重新审视这些数据，并质疑这些结论。

许多研究人员现在认为，实际情况要复杂得多，因为面部表情在不同的背景和文化中差异很大。例如，瑞秋的研究发现，虽然西方人和东亚人在表达痛苦时有着相似的面部表情，但他们对快乐的表达却差异极大。

研究人员对埃克曼结论的质疑越来越多。但是这场辩论并没有阻止公司和政府接受“脸是情感窗口”的结论，在西方许多法律制度中，解读被告的情绪是审判的一部分。美国最高法院法官安东尼·肯尼迪（Anthony Kennedy）在1992年曾写道，这样做对于“了解罪犯的心灵”是必要的。

埃克曼为TSA（美国运输安全管理局）设计并于2007年推出了一个有争议的培训计划，解码情绪就是该计划的核心。这项名为SPOT（通过观察技术对乘客进行筛查）的计划，旨在教导TSA人员如何监控乘客是否有几十个可疑的信号，这些迹象代表了压力、欺骗或恐惧。但是，该计划受到了科学家的广泛批评，认为其不准确、且带有种族偏见。

科技公司已经开始利用AI来进行情绪识别

这种担忧并没有阻止科技公司利用这一理念。一些公司已经开发了APP来感知情绪，这些系统被用于求职者评估、测谎、增加广告的吸引力，甚至是诊断痴呆症、抑郁症等疾病。

据估计，该行业的价值为数百亿美元。包括微软、IBM和亚马逊在内的科技巨头，都在开发通过面部检测情绪的算法。

由于研究人员仍在争论人们面部表情对于传达情绪的保真度，许多该领域的人认为，试图让计算机自动做到情绪识别还为时过早——尤其是当该技术可能产生破坏性影响时。纽约大学的研究中心AI Now研究所甚至呼吁禁止在诸如招聘或执法等敏感情况下使用情感识别技术。

俄亥俄州立大学的专家阿莱克斯·马丁内斯（Aleix Martinez）说，面部表情很复杂，即使人也经常出错。考虑到这一点，他说，鉴于自动化的趋势，“我们应该非常谨慎”。

01 情绪和表达只隔一层皮肤

人的面部有43块肌肉，能够形成多种表情。但长期以来科学家们一直认为，某些表达方式能传达出特定的情感。

推动这一观点的先驱是查尔斯·达尔文（Charles Darwin）。他在1859年出版的《物种起源》堪称观察学的大师级别，他在1872年的第二部作品《人类与动物的情感表达》则更加鲜明地表达了这一观点。

达尔文指出，灵长类动物的面部动作看起来像人类的情感表达，如厌恶或恐惧，并认为这些表情必须具有一定的适应功能。

例如，嘴唇弯曲、皱起鼻子和眯起眼睛这种与厌恶相关的表达，可能起源于保护个体免受有害病原体的侵害。只有当社会行为开始发展时，这些面部表情才会起到交际的作用。

达尔文关于情绪的论文中提到很多情绪的表达方式，图为受试者尽力作出悲伤的表情

埃克曼在20世纪60年代进行的第一次跨文化实地研究也支持了这一假设。他测试了世界各地对六种主要情绪——幸福、悲伤、愤怒、恐惧、惊讶和厌恶——的表达和感知。

埃克曼说，这些早期研究证明了达尔文进化论所预言的普遍性。后来的研究支持了这样的说法，即一些面部表情可能会带来适应性优势。

波士顿东北大学的心理学家丽莎·费尔德曼·巴雷特（Lisa Feldman Barrett）说：“长期以来的假设是，面部表情是潜意识的动作。”

换句话说，我们的脸无力隐藏我们的情绪。这个假设的问题在于，人们可以假装情绪，可以产生感情而不露声色。

“我们尽最大的努力，抛开以前研究的影响，”巴雷特说，他们不是从假设开始，而是从数据入手。“当出现分歧时，我们扩大了对证据的搜索范围。”

他们最终阅读了大约1000篇论文。两年半后，研究小组得出了一个鲜明的结论：几乎没有证据表明，人们能从一组面部动作中可靠地推断出别人的情绪状态。

面部表情其实并不能准确地传达情绪

缺乏普遍表达的一个原因是，面部不是人类表达情绪的全部。

身体姿态、个性、语气和肤色的变化，都在我们感知和表达情绪方面起着重要的作用。例如，情绪状态的变化会影响血液流动，反过来又会改变皮肤的外观。

除了面部表情，人类还有很多表达情绪的方式

02 情绪是复杂的

加拿大哥伦比亚大学的心理学家杰西卡·特蕾西（Jessica Tracy）认为，根据一些反例就判定埃克曼的普遍性理论错误，是有失偏颇的。她说，一个人种或文化对是什么使愤怒的面孔有了略有不同的想法，并不能推翻整个理论。

她补充说，大多数人看到一张愤怒的脸时都会认出来图片上的人很生气，“大量证据表明，世界上大多数文化中的大多数人确实认为这种表达方式是普遍的。”

特蕾西争辩说，巴雷特将他们的结论描绘成六种情绪和面部动作之间的一对一的硬性映射。“我相信情感科学领域的任何研究人员都不会认为这是事实。”

特蕾西认为，理解面部表情所需要的是一种更丰富的情感分类法。比如，研究者不应该把幸福视为一种情感，而应该将情感类别分为几个组成部分，幸福应该包括快乐、快乐、同情、骄傲等等，每种表达可能不同或是重叠。

特蕾西认为，理解面部表情所需要的是一种更丰富的情感分类法

辩论的核心是：特征达到什么标准才算是显著的。

在一项研究中，参与者为所见到的每张脸选择六个情感标签之一，一些研究人员可能会认为，选择超过20%的选项具有显著的共性。其他人可能认为20%远远达不到标准。杰克认为埃克曼的门槛太低了。

她说： “这些上世纪六七十年代的图表，每一张都显示出文化认知的巨大差异。没有数据显示情绪得到了普遍认可。 ”

除了显著性之外，研究人员还必须与主观性作斗争：许多研究中实验者在测试开始前就给情感打了标签，以便对最终结果进行比较。因此，巴雷特、杰克和其他人正试图找到更中性的方法来研究情绪。

巴雷特正在研究生理测量，希望为愤怒、恐惧或喜悦提供一个指标。而杰克不使用人为拍摄的照片，而是使用电脑随机生成的面部表情，以避免情绪固定在常见的六个人身上。其他研究者则要求参与者将人脸分为他们认为的情感类别，或者让来自不同文化背景的参与者用自己的语言标记图片。

03 硅基世界中的情绪

在算法的世界，不能存在这么多模糊和不确定性。

一个典型的人工智能程序，需要从数以百万计的图像和数百小时的视频片段的面部表情中识别特征，把每个情绪标记出来，让AI从中辨别。

Affectiva公司说，它的软件已经经过了来自87个国家的700多万张人脸的训练，准确率达到了90%，但该公司拒绝对其算法背后的科学原理发表评论。

Affectiva承认，面部表达情感的方式存在差异，“但当一个人有情绪要表达时，这些表达在面部发生的频率要比其他方式多”。然而，研究人员对这种软件持怀疑态度，一方面出于对用于训练算法的数据的担忧，一方面是其背后的科学问题仍在争论。

埃克曼说，他直接质疑了这些公司的主张。他已写信给几家“世界上最大的软件公司”，要求查看其自动化技术能够发挥作用的证据，但没有得到任何答复。“据我所知，他们所声称的是毫无根据的东西，”他说。

马丁内斯让步说，自动情绪检测也许能够判断出一组人的平均情绪反应。例如，Affectiva向营销机构和品牌销售软件，以帮助预测客户群对产品或营销活动的反应。

自动情绪检测也许能够判断出一组人的平均情绪反应

如果这个软件犯了一个错误，那么代价是比较低的，无非广告效果可能比预期的要差一点。但是，如果算法被用于可能对人们的生活产生重大影响的领域，例如在工作面试和入境检查中，情况就不是如此了。

去年，匈牙利、拉脱维亚和希腊试行了一种对旅行者入境预筛查的系统，旨在通过分析面部微表情来检测欺骗行为。

解决情绪表达的争论还在继续。巴雷特经常被要求向科技公司介绍她的研究，她认为研究人员需要像达尔文撰写《物种起源》时所做的那样：观察、观察、再观察。

观察人们在现实生活中是如何通过面部和身体表达情绪的——而不仅仅是在实验室里，然后使用机器记录和分析真实世界的素材。

文字 | 黄一成

版面 | 田晓娜

打开APP阅读更多精彩内容