AI绘制“通缉令”,全球“缉拿”COVID-19
2020-10-29 22:38
石溪分校的一个研究小组首次公布基于物理原理的冠状病毒蛋白质草图,“功勋”也有超级计算机Summit上的GPU一份。
借助AI和超级计算机模拟,Ken Dill的团队为一组构成COVID-19的蛋白质绘制了一张“通缉令”。如果幸运女神兼顾,通过其中一张“画像”或许就能将新冠病毒“绳之以法”。
大流行袭来“对全世界而言是一次恐怖的事件,对我们来说则是一个巨大的研究挑战,”石溪分校Laufer物理和计量生物学中心负责人Dill表示。
过去十年,他帮助该中心招募研究人员,并收集用于研究蛋白质内部工作机制的工具(蛋白质是对细胞生命至关重要的复杂分子)。该中心一贯关注病毒蛋白质的研究,致力于通过蛋白质失效给病毒“致命一击”。
“因此,当疫情爆发时,我们的研究人员希望立即采取行动。” Dill补充道。
AI和模拟在超级计算机Summit上相遇
该团队的目标是结合物理和AI工具,根据定义冠状病毒蛋白质的氨基酸序列,预测十多种冠状病毒蛋白质的三维结构,并获得了在橡树岭国家实验室(Oak Ridge National Laboratory)建造的超级计算机Summit上处理复杂计算的机会。
“我们在30个GPU上一对一地并行运行了30个非常广泛的模拟,并持续了至少4天,”Laufer中心的初级研究员Emiliano Brini解释说,“Summit是一台伟大的机器,它有足够多的GPU让我们可以并行运行许多模拟。”
“基于物理的建模耗费了大量时间,选择借助GPU几乎完全出于对速度的需求。” Dill说。
分享研究成果,帮助推进研究进程
在GPU加速的赋力下,预测结果终于得出。Laufer的研究团队立刻将它们分享给大约100名研究人员,他们分属于十几个不同的项目组,通过开展艰苦而漫长的实验确定蛋白质的实际结构。
Dill说:“这些研究人员表示,如果此前能从我们的工作成果中预知这些3D结构,一些实验也许可以开展得更快。”
现在我们只需等待——如果其中一种预测结构能帮助研究人员找到药物制造商可以利用的弱点,那将是一个巨大的胜利。这是科学将通用抗病毒药物从实验室转移到药房货架的向前一步。
机器学习和物理学的融合
Dill的团队借助一种名为MELD的分子动力学程序将物理模拟与基于统计模型的机器学习结合在一起。
AI为MELD提供关键信息从而根据氨基酸序列预测蛋白质的3D结构。它可以在一个收录原子级别信息的数据库中快速发掘过去50年来收集的20万种蛋白质组成的模式。
MELD在需要密集地开展计算的物理模拟中通过这些信息确定蛋白质的细节结构,更进一步的模拟则可以预测例如何种药物分子会与特定的病毒蛋白紧密结合。
“因此, AI推理和物理模拟这两个领域对于药物研发有着重要的推动作用,”Dill说。“我们获益于这两种方法,我相信二者结合正是未来药物研发的关键所在。”
MELD运行在NVIDIA的GPU加速计算平台CUDA上,“在CPU上运行模拟所需的时间令人望而却步,所以大多数生物模拟是在GPU上完成的。”Brini说。
静候佳音
COVID-19的挑战让Laufer的研究人员对化学充满激情,成为他们的研究重点。现在他们正在等待借助超级计算机Summit完成的工作的反馈。
“一旦我们得出结果,我们将公布我们从错误中学到的东西。很多时候,研究人员不得不从头开始。”他说。在等待的时间里,他们也偶尔会庆祝。
在超级计算机Summit上的工作完成后,Dill在自家后院为几名同事举办了一个小型的社交聚会。如果这些结果中有一个宣布成功,为之欢庆的将远不止石溪分校。