在2021年7月,AlphaFold2的开源发布标志着AI for Science(AI4S)的一个重要里程碑。这一事件展示了AI在科学研究中解决实际问题的巨大潜力,引发了全球科研界的广泛关注。
随着时间的推移,AI4S不仅在生物医药领域取得了突破性进展,还在材料科学、物理学等基础学科中展现出强大的应用前景。
展望未来,AI将在制药、材料科学、核聚变反应控制等多个领域继续发挥其强大的作用,并有望助力科研解决维度灾难等复杂问题。
药物研发新纪元:AI颠覆传统制药
AI在制药领域的应用显著提高了药物研发的效率和精准性,改变了传统药物研发周期长、成本高的现状。
在靶点发现及验证阶段,AI利用自然语言处理(NLP)和知识图谱技术,从海量数据中发现创新性药物靶点,避免了人为偏见和遗漏。
在候选化合物发现阶段,AI通过虚拟筛选和端到端的化合物生成,利用深度学习模型快速筛选并优化化合物,从苗头化合物(hit)到先导化合物(lead),再到临床前候选化合物(PCC)。
量子位AI制药深度产业报告
AI还通过生成对抗网络和强化学习,基于靶点生成新颖的药物分子,快速进入临床前开发环节,减少了传统筛选时间和成本。例如,2022年晶泰科技通过智能算法和实验验证,大幅缩短了辉瑞口服新冠药物PAXLOVID的研发周期,仅用六周就完成了药物晶型预测与实验验证。
AI技术通过预测候选药物的ADMET属性(吸收、分布、代谢、排泄及毒性),优化药物设计,提高研发成功率。例如,AlphaFold2成功预测了大部分人类蛋白质结构,大大缩短了新药研发周期。AI设计的类病毒蛋白质也提升了基因疗法效果。
AI赋能材料科学:开启未来新材料时代
AI在材料科学中的应用令人瞩目,能够显著加快新材料的发现和设计。例如,DP-GEN深度势能生成工具可以以第一性原理精度预测材料在不同温度和压力下的相变,优化现有材料性能。
2023年,劳伦斯伯克利国家实验室与Google DeepMind合作开发了A-Lab,一个结合机器人技术与AI的新材料发现系统,能在最少人为干预下迅速发现新材料。在测试中,A-Lab成功合成了58种预测材料中的41种,成功率71%。【1】
智能材料也展现出巨大潜力。基于AI设计的软材料外骨骼轻便灵活,能根据外部刺激进行形变,适应性强。在康复医疗、老年护理和军事领域,这些材料能提高患者和士兵的行动能力和效率。AI通过深度学习和大数据分析,实时监控和优化材料性能。
未来,随着AI技术的突破,科学家将更快发现和测试新材料,推动技术创新,如轻质合金、高效太阳能电池和更快的晶体管。AI将加速新材料的开发和应用。
AI控制核聚变:迈向清洁能源新高度
人工智能(AI)在核聚变这一清洁能源领域的应用尤为突出。AI通过机器学习技术在普林斯顿等离子体物理实验室(PPPL)实时监控和调整核聚变反应堆内的磁场分布,成功解决了等离子体不稳定性问题,提高了控制精度和能量输出效率。
例如,AI开发的3D场优化系统能够避免边缘局域模(ELM)爆发,显著提升等离子体的约束质量。
在DIII-D和KSTAR两个托卡马克装置上的测试中,系统实现了几乎完全无边缘爆发的状态。
此外,AI还优化了多种加热方法和等离子体容器设计,确保反应的长时间稳定控制。PPPL的成功展示了AI在核聚变研究中的巨大潜力,为全球核聚变研究提供了宝贵经验和技术支持
。随着AI技术的发展,核聚变作为清洁、可靠的能源来源,有望在未来实现广泛应用,为人类提供持续的能源供应。【2】
破解维度灾难:AI变革高维数据处理
人工智能(AI)在科学研究中正逐渐展现出巨大的潜力,尤其在应对“维数灾难”这一复杂问题时。维数灾难指的是随着变量或维数的增加,计算复杂度呈指数级增长,传统的多项式逼近方法在高维情况下变得无效。AI,特别是深度学习技术,提供了有效的解决方案。【3】
深度学习中的神经网络能够逼近高维空间的函数,解决了多项式方法在高维情况下的局限性。例如,图像识别本质上是在处理一个3072维的函数,传统方法难以实现,但神经网络能够有效逼近这一高维函数。同样,AlphaGo通过解高维空间的Bellman方程,展示了深度学习在复杂决策问题中的优势。【4】
鄂维南《AI for Science:一场正在发生的科技革命》|理解未来科学讲座实录
另一个重要的例子是DeePMD,它通过深度学习优化分子动力学模拟,实现了高效且精确的材料和化学计算。例如,DeePMD成功模拟了水的相图,精确预测了水在不同温度和压力下的状态,这在传统方法中是难以实现的。
此外,深度学习在大气科学和海洋科学中的应用也展现了其潜力。例如,AI被用来优化湍流模型,显著提高了天气预报的准确性和海洋模拟的精度。这些例子展示了AI在不同科学领域的广泛应用,包括计算化学、材料科学和环境科学。
开源创新浪潮:DeepModeling与AISI的崛起
随着AI for Science的不断发展,开源社区和工具的创新成果不断涌现。DeepModeling社区【5】通过开发DeePMD-kit和ABACUS等开源工具,推动了分子动力学和材料模拟计算的发展。AI技术在这些领域取得了显著进展,如深度势(DP)模型和SchNet模型,不仅提高了计算精度,还显著提升了效率。例如,DP模型在处理大规模系统时,比传统的密度泛函理论(DFT)快了几个数量级,同时保持了相同的精度。
北京科学智能研究院(AISI)推动了AI for Science的开源社区建设,通过平台化工具和开源社区,将科研从“小农作坊模式”转变为“安卓模式”,实现规模化和自动化。例如,dp-gen和dpdispatcher等开源工具能够高效生成和管理大规模数据,显著缩短研究周期,提升研究结果的可靠性。这些开源工具和创新成果大幅提升了科学研究的效率和效果,加速了各领域的研究进程。
面向未来:AI for Science的无限可能
目前的AI主要指深度学习,利用CNN、RNN、LSTM和Transform等模型,通过梯度下降和损失函数优化,具有强大的拟合和信息压缩能力,适合处理高维数据。
汤超院士在2022科学智能峰会指出,AI for Science包括三个层次:一是将AI应用于科研和技术创新,如解决量子力学方程、设计化学分子路径和蛋白质折叠;二是利用AI发现新的科学规律,如通过行星运动数据预测轨道;三是研究AI背后的科学原理,如Giorgio Parisi在自旋玻璃模型中的工作。AI的进步将帮助我们更好地理解人类智能。
AI for Science旨在拓宽人类的知识边界,目前仍是一门实验科学,其最佳应用领域是需要模拟仿真的实验科学,而难以服务于理论科学。人类获取知识的方式主要包括推理、归纳和演化。推理最为严密,现在许多数据中心模型实际是对数据的压缩和模式提炼,而强化学习则通过外部刺激进行调整,反映了实用主义的方法。
未来,AI for Science将继续突破现有的边界,深度学习与量子计算结合、AI驱动的自动化实验室、个性化医疗的实现、智能制造与新材料开发、环境保护与可持续发展,以及宇宙探索,都将展现其无限潜力。
AI将不仅加速科学发现,还将优化实验和生产流程,提高效率和精准度。我们期待,AI for Science能够为科研从“小农作坊模式”向“安卓模式”的转变提供强大动力,推动人类科学进入一个全新高度。
注释:
【1】Nature重磅:17天独自创造41种新材料,AI再次赢了人类_澎湃号·湃客_澎湃新闻-The Paper
【2】可控核聚变新里程碑,AI首次实现双托卡马克3D场全自动优化,登Nature子刊 (qq.com)
【3】鄂维南院士:机器学习解维数灾难,传统科学领域是AI主战场_科学湃_澎湃新闻-The Paper
【4】鄂维南《AI for Science:一场正在发生的科技革命》|理解未来科学讲座实录-大数据分析与应用技术国家工程实验室 (pku.edu.cn)
【5】DeepModeling