寻找蛛丝马迹:AI研究人员使用肿瘤DNA追踪致癌因素
2020-09-30 16:34
来自Cancer Grand Challenges研究项目的Mutographs团队使用NVIDIA GPU,分析体细胞突变的分子特征。
人生中做出的选择,真的可以改变一个人的基因。
在人的一生中,细胞中的基因变化(称为体细胞突变)是绝大多数癌症的起因。它们可能是由环境或行为因素触发的,例如紫外线、辐射、饮酒或吸烟。
研究人员使用NVIDIA GPU对这些突变的特征或分子指纹进行分析,就能更好地了解癌症的已知原因、发现新的风险因素,并调查为何某些癌症在世界上特定区域中更为常见。
来自Cancer Grand Challenges研究项目中的Mutographs团队是一支国际研究团队,得到了英国癌症研究中心(Cancer Research UK)的资助。该团队正在使用NVIDIA GPU加速的机器学习模型研究来自5,000位患者的五种癌症肿瘤DNA,包括胰腺癌、肾癌、大肠癌、以及两种食道癌。
作为全球基因组学领导者,来自Wellcome Sanger研究所和加州大学圣地亚哥分校的研究人员与NVIDIA开发人员合作,借助强大的NVIDIA DGX系统,使机器学习软件SigProfiler运行速度实现30倍以上提升。
Wellcome Sanger研究所信息支持小组负责人Pete Clapham表示:“Mutographs Grand Challenge研究项目旨在超越一切可能性。NVIDIA DGX系统提供了可观的加速能力,使Mutographs团队不仅能够满足项目的计算需求,还能进一步推动研究进程,有效实现之前不可能实现的结果。”
“分子侦探”工作
就像每个人都有独特的指纹一样,在细胞的DNA中,致癌的体细胞突变也具有独特的样式。
“在犯罪现场,调查人员会提取指纹,并通过数据库搜索匹配指纹。”该项目计算主管,加州大学圣地亚哥分校细胞与分子医学助理教授Ludmil Alexandrov说道。“与之类似,我们可以从患者的活检细胞中获取分子指纹,并对照它是否与吸烟或紫外线照射等致癌因素相匹配。”
正如Alexandrov所说的那些致癌因素,部分体细胞突变的源头是已知的。除此之外,机器学习模型还能提取出其他突变样式,这些突变样式会反复出现在特定癌症患者身上,但突变的源头却是未知的。
面对这种情况,Alexandrov与其他科学家共同对假设进行了测试,并积极展开大规模实验,从而探究出引起癌症的罪魁祸首。
探究新的致癌因素可助力癌症预防。2018年,研究人员在追溯皮肤癌的突变特征时,追溯到一种免疫抑制剂药物,该药物现已将皮肤癌列为可能的副作用之一。这一发现也有助于医生更好地监测正在接受该药物治疗的患者。
开启全球数据旋风之旅
在已知突变特征源头的情况下,研究人员能够分析特定种类体细胞突变(及其对应的癌症)在全球不同地区的病患情况,及其发展趋势。
“某些癌症在世界特定地区非常普遍,而在其他地区却非常罕见。当人们从一个国家迁移到另一个国家时,往往会增加其患上移居国中常见癌症的风险,这说明环境是患病的主导因素。” Alexandrov说道。
Mutographs项目的研究人员正在研究与食道癌相关的体细胞突变,一些研究认为这种突变与茶或马黛茶等高温热饮有关。
食管癌在南美东部、东非和中亚比在北美或西非更为常见。鉴别出较高风险的环境或生活方式,有助于预防并尽早发现病例。
食管鳞状细胞癌病例数量在全球范围内差异很大
图片来源:Mutographs项目
数据来源:GLOBOCAN2012
Alexandrov表示,Mutographs团队的研究人员与NVIDIA合作,基于NVIDIA GPU对SigProfiler AI框架中最耗时的部分进行了加速。在NVIDIA DGX系统上以双精度运行管线作业时,与使用CPU硬件相比速度提升30倍以上。在单精度下,SigProfiler运行速度明显加快,实现约50倍的加速。
通过使用DGX系统的优化软件和NVLink互连技术,还能在系统中8个NVIDIA V100 Tensor Core GPU上扩展AI模型,从而在模型开发和部署时实现最佳性能。
Alexandrov的团队今年发表在《自然》杂志上的研究,是基于对20,000多名癌症患者的数据进行分析得出,而此类分析在过去往往需要耗费近一个月的时间。
Alexandrov表示:“借助NVIDIA DGX,我们现在花费不到一天的时间,就能完成同样的分析过程。这意味着我们能够开展更多的测试、验证和探索。”