不到现场,照样看最干货的学术报告!
嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。
人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。AI未来说·青年学术论坛自 2019 年 1 月 19 日启动以来,论坛已连续举办十二期,累计吸引上万人报名参加,报名群体遍布全国三十多个省份,境内外十三个国家,四百余所高校和科研院所。第十二期AI未来说·青年学术论坛(百度奖学金博士生特别专场)已于2020年1月5日下午在北京市百度科技园 K6 报告厅举行。UIUC罗宇男博士为大家带来报告《AI-assisted Scientific Discovery in Interdisciplinary Research》。
罗宇男是伊利诺伊大学厄巴纳-香槟分校计算机科学系的博士生,师从 Jian Peng 教授。研究兴趣主要涉及人工智能在计算生物学等多个交叉学科的应用。
报告内容:罗博士团队结合 AI 与各学科的交叉研究工作。主要包括三方面:AI 与新药发现、AI 与生物技术,以及AI 与智慧农业。
AI-assisted Scientific Discovery in Interdisciplinary Research
药品的价格昂贵,一定程度上是因为药物研发是一个高成本、长周期、低成功率的过程。近些年有一种药物研发的新策略叫老药新用,是指发掘已上市的药物能否有新的适用病症。老药新用一般需要经过长期反复尝试,或是在偶然的场合下才能发现。罗博士的团队希望利用现有的海量生物数据,结合 AI 技术,从而更多、更高效地发现老药新用的例子。团队在现有的数据基础上挖掘了大规模的医药生物关联关系,构建了药物与蛋白、药物与所治疗的疾病、药物与副作用之间的关系网络。基于该网络设计了一个机器学习模型,结合网络算法降维、去噪,再结合矩阵填充技术,针对药物和蛋白之间的作用关系进行预测,取得了优越的预测准确率。团队进一步利用现有的所有数据训练模型并进行预测,在模型的前一百个药物和蛋白作用关系预测结果中,有大约80%的预测 都可以在最近几年的科研文献中得到印证。对于剩下20%未在文献中找到印证的药物蛋白作用关系预测,团队进一步与药物学家进行合作,开展生物实验,并证实了模型所预测的多个药物-蛋白作用关系的确是存在的。比如,一种药物最初上市是用于治疗高血压,而模型预测其还能用于抗炎症的靶点蛋白,这一预测也得到了生物实验的验证。
2018 年诺贝尔奖颁发给了一种叫做蛋白质定向进化的生物技术,这项技术的目的是想提升现有蛋白质的某种功能或者性质,类似于自然界的优胜劣汰过程,这种技术通过在自然界已经存在的蛋白质随机引入新的突变,经过每一轮的迭代进行淘汰和筛选,最后进化出我们想要的某种功能蛋白,比如活性更高的酶和催化剂等等。这本身是一项很好的技术,但每一轮迭代都需要随机地引入大量新突变,带来了很大的实验工作量。能不能用 AI 来推荐突变,从而指导生物实验并使实验过程更高效呢?
罗博士的团队设计了一套 AI 辅助的实验框架,实验中迭代的每一轮都用 AI 模型预测蛋白质序列中哪些位置突变成哪些氨基酸能够更大概率地提升蛋白质的性质,然后生物学家再根据次预测进行实验,并反馈给AI框架,反复迭代下去,进而极大地减少了实验的工作量。具体应用中,该模型还考虑了生物性质,如利用现有自然界蛋白质序列训练无监督语言模型,从而推断出哪些突变大概率是有害的,哪些突变是自然界中存在的可能性较低的;又如根据蛋白质序列比对中的协同进化规律,利用概率图模型来推断出蛋白质序列中的高阶约束关系,从而预测突变对蛋白质结构稳定性和功能完整性的影响。这一模型还能用于探索提高催化剂和酶的活性,帮助发现活性更高的酶和催化剂。
在智慧农业中经常用到卫星数据,而现有的卫星图像数据无法兼顾分辨率和时效性——高分辨率的卫星环绕速度慢,环绕速度快的卫星分辨率低。为了帮助对农田进行实时监测,罗博士的团队开发了一套卫星数据融合算法,把不同分辨率、不同拍摄频率的数据融合在一起,生成了一套每天都有的高清图片。基于这些卫星图像数据,团队还开发了一系列 AI 模型,如用计算机视觉的模型预测农田面积,预测农田用水量,预测今年收成等。团队还设计了在线可交互的平台,供农业从业人员实时监测。
罗博士说,他关注交叉学科研究,也把计算机技术和人工智能技术运用到了健康、生物、化学和农业不同的交叉学科当中,解决了一些重要的科学问题。未来,还希望更多地研究这样的科研问题,让计算机科学不仅在其学科自身发展,更能走出去解决民生等问题。
留言 点赞
我们一起分享AI学习与发展的干货