Nat Mach Intell:计算机模型帮助寻找COVID19治疗方法

根据最近一项研究,一种可以预测人类基因和药物相互作用方式的新的深度学习模型已经确定了至少10种可能有望作为COVID-19疗法的化合物。除两种药物外,所有药物均仍被认为是研究性药物,并且正在针对丙型肝炎,真菌病,癌症和心脏病进行有效性测试。该清单还包括批准的药物环孢菌素和抗真菌药阿尼芬净。

该发现是由计算机科学家做出的,这意味着需要进一步研究证明这些药物中的某种对SARS-CoV-2感染者是安全有效的治疗方法。但是,通过使用人工智能来实现这些选择,节省了医药和临床研究人员零散地寻找潜在的COVID-19药物所需的时间和金钱成本。

“当没有人掌握有关一种新疾病的任何信息时,这种模型就说明了人工智能如何帮助解决如何考虑可能的治疗方法的问题,” 俄亥俄州立大学助理教授Ping Zhang说。

研究人员在论文中指出,已经对模型产生的一些具有重用性的候选物在COVID-19患者中的潜在用途进行了研究。该研究发表在《Nature Machine Intelligence》杂志上。

Zhang和他的同事在2020年5月完成了该模型的设计,第一篇文章详细介绍了COVID-19患者基因如何对该病毒作出反应。研究人员将其称为“ DeepCE”,发音为“ Deep Sea”。

为了预测基因和药物将如何相互作用并产生可替代药物的候选药物,DeepCE依赖于两个主要的公开数据来源:L1000,这是美国国立卫生研究院资助的人类细胞系数据存储库,其显示基因表达如何响应药物和DrugBank,其中包含有关约11,000种已批准和研究用药物的化学结构和其他详细信息。

L1000显示标准基因表达活性与特定药物相互作用产生的基因表达变化的并列细胞系比较结果。细胞系代表疾病,例如黑素瘤,以及器官,例如肾脏和肺。

俄亥俄州立大学的研究人员通过针对特定化合物及其剂量的算法运行所有L1000数据来训练DeepCE模型。为了填补数据空白,该模型将化学化合物的描述转换为数字,从而自动考虑它们各自的成分对基因的影响。对于L1000中未表示的基因,该团队使用了一种称为“注意力机制”的深度学习方法,以增加该模型对基因-化学化合物相互作用的“学习”样本,从而改善了框架的性能。

“以这种方式,我们可以预测新化学物质的基因表达值,可以自动预测药物在不同细胞系和不同基因上的作用。”

该团队将DeepCE的基因表达预测矩阵应用于早期COVID-19论文和其他政府数据提供的遗传信息。COVID-19数据证明了人类基因表达对SARS-CoV-2感染的反应如何。

“基于已知药物已经发生并鉴定出的已知基因表达变化,我们将其应用于所讨论的基因表达—在这种情况下,我们正在研究但尚未在L1000中进行实验的化合物。”Zhang说。

打开APP阅读更多精彩内容