昨日下午,美国计算机协会(ACM)宣布,Andrew Barto 和 Richard Sutton 荣获 2024 年 ACM A.M. 图灵奖,以表彰他们在强化学习领域奠定的概念与算法基础。

据了解,从 20 世纪 80 年代起, Barto 和 Sutton 通过一系列论文提出了强化学习的核心思想,构建了其数学基础,并开发了关键算法,使其成为智能系统研究中最重要的方法之一。

值得一提的是,被誉为「强化学习之父」的 Richard Sutton,曾是 Barto 的博士及博士后学生,两人的师生合作成就了这一领域的基石。

目前流行的 ChatGPT 和 DeepSeek 均广泛使用了强化学习技术。强化学习的应用还涵盖了多个领域,包括网络拥塞控制、芯片设计、提升聊天机器人的行为和推理能力以及改进计算机科学中的经典问题。

此外,包括 Barto 在内的研究表明,某些强化学习算法实际上是对人脑多巴胺系统运作机制的最佳解释之一,加深了人类对大脑学习过程的理解。

ACM 主席 Yannis Ioannidis 评价表示,Barto 和 Sutton 的贡献不仅仅是一个过渡阶段的成果,而是一个仍在持续发展的领域。强化学习仍在不断进步,不仅推动计算机科学的发展,也为许多其他学科带来了无限可能。因此,ACM 授予他们计算机领域最具影响力的奖项。