深度学习助力科学家进一步了解太阳系的历史
2018-10-15 12:28
数千年来,月球一直引人遐想,但关于它以及太阳系的历史,仍有数不清的问题悬而未决。有些答案就存在于月球表面坑坑洼洼的陨石坑中。通过深度学习,科学家能够比以往更清楚地看到这些陨石坑。
多伦多大学行星科学中心的博士后研究员、天体物理学家Mohamad Ali-Dib表示,可以将陨石坑研究看作“太阳系考古学”。
由于缺乏大气和地质活动,月球、水星和火星等天体的地形特征会在一段时间内保持相对不变。对于诸如此类天体中无空气环境的探索,研究陨石坑是一种特别有用的方法。
仔细观察这些陨石坑,就能发现有关陨石坑历史和太阳系演化的重要线索。但到目前为止,陨石坑是通过卫星图像或卫星测高数据的方式进行人工计数和测量的。
“研究生全天的工作是捕获水星、月球或火星的图像,然后手动去数每个陨石坑。这是一项极其辛苦的工作。” Ali-Dib说道。
他指出,人工计数存在一些问题。这将需要“一大批研究生和本科生”来完成这项繁重而艰巨的工作。这种方式是有缺陷的,因为每个助理研究员识别陨石坑的标准可能不同,而且当他们疲劳的时候准确率也会下降。
因此,Ali-Dib和多伦多大学的同事Ari Silburt以及其他组员,共同研发出了一个神经网络,可以在几个小时内识别出数千个以前未被发现的月球陨石坑。
聚焦月球
陨石坑的形状大小不一,有的大到足以容下一个州,而有的小到直径只有几米。对于火星上陨石坑数量的估计众说纷纭,从30万到63.5万余个不等,而月球上则有数百万个。
科学家们最感兴趣的是计算出不同大小陨石坑的分布情况,即计算出表面上有多少指定半径的陨石坑。根据分布情况,他们可以了解造成陨石坑的撞击物的大小和数量,这也正是天体物理学家可以将其与太阳系碰撞理论相关联的信息。
其中一个理论是:巨行星不稳定。一些科学家推测,在太阳系的早期,像木星和土星这样的气态巨行星的轨道在一段时间内曾变得混乱无序。根据此理论,轨道混乱会将小行星抛向整个太阳系,从而导致激烈的碰撞。这样的天体运动就会在像月球这样的环境中留下痕迹,即大小不一的陨石坑分布。
通过计算机记录月球陨石坑,科学家们可以更好地了解月球陨石坑的大小及其分布情况。这反过来又为他们提供了更多的数据,从而证实太阳系历史的理论。
研究人员在SciNet HPC Consortium 的P8超级计算机上使用 NVIDIA Tesla P100 GPU进行训练和推理。
在对月球图像进行分析时,研究人员的卷积神经网络在发现已确定的陨石坑方面的准确率达到了92%。除此之外,深度学习模型在短短几小时内就发现了6000个新的陨石坑。这几乎是人们在数十年的研究过程中手动识别数量的两倍。
Ali-Dib指出,其中大部分是研究小组希望通过神经网络捕获的较小陨石坑。这些微小的陨石坑是现有数据集中缺少的部分,因为它们太小太多,无法花费昂贵的人工时间来记录。
左图:测试数据中的月球样图。中图:研究人员的神经网络成功识别出以前人工编码的陨石坑(蓝色)和数以千计的新陨石坑(红色)。右图:人工编码的地面实况数据,用于评估神经网络。蓝色圆圈表示与研究人员的方法匹配成功的陨石坑,而紫色圆圈则表示神经网络遗漏的陨石坑。
近观月球以及其他星体
除了可以更详细地了解月球外,还可以通过类似的卫星数据了解水星和火星。未来可能还将研究其他无空气天体(如小行星、彗星和一些巨行星)的卫星数据。
研究人员已经利用一种叫做迁移学习(transfer learning)的技术观察水星的陨石坑:他们利用其采用月球数据训练的神经网络来分析水星的图像。
此外,研究小组还在研究陨石坑深度等其他特征。科学家感兴趣的另一个参数是陨石坑的年龄。但Ali-Dib表示,要弄清楚这一点,仅靠卫星数据远远不够,还“需要真正的陨石”。