洞悉银河,AI为天文学家研究银河系赋予洞察力
2020-02-03 15:45
和现代年轻人们的自拍照数量比起来,天文学家们制作的银河系图像库的倍增速度要远比其快的多。
在天文学研究过程中,天文学家们已经收集了数百万张图像。但随着近期关于暗能量研究和后续的关于空间及时间的研究项目的逐步开展,这一数量将呈螺旋式上升趋势,预计这些研究项目将再收集数十亿的数据。
此前,一个名为Galaxy Zoo的众包(crowdsource)项目吸引了大量的志愿者参与项目,帮助天文学家们对斯隆数字天空研究项目(Sloan Digital Sky Survey)中的100多万张星系图像进行分类。但是公众对于天体物理学的帮助所能达到的程度,也仅此而已了。
伊利诺伊大学香槟分校(the University of Illinois at Urbana-Champaign)的物理学博士Asad Khan说:“Galaxy Zoo是一次成功的尝试,但在接下来的研究当中,其收集数据的速度之快,是这种众包方法所无法满足的。这就是为什么人们需要提出新的方法,通过AI技术来推进数据驱动型发现的进程,其中就包括包括图像分类。”
借助于迁移学习技术,Khan和他的同事们利用当前流行的图像分类模型Xception开发出了一种神经网络,可以将星系图像分类为椭圆形或螺旋形星系,而且具有专家级的精度。对星系形状进行分类,可以帮助科学家们确定星系的年龄,而且还可以帮助科学家们理解更为复杂的问题,如关于暗能量和宇宙膨胀的速度。
自动化星系分类可以减少天体物理学家在标记上所花费的时间,从而将其精力投入到更为复杂的研究当中。
此研究项目是首次将深度迁移学习应用于银河系分类当中,也是SC19年度超算大会上所展示的六项科学可视化和数据分析项目之一。
AI为天文学研究提速
研究人员使用斯隆数字天空研究项目(Sloan Digital Sky Survey)中的35,000张星系图像训练该深度学习网络。借助于阿贡国家实验室(Argonne National Laboratory)的Cooley超级计算机,研究小组将神经网络训练时长从5小时加速到8分钟,该超级计算机配备了数十个NVIDIA数据中心GPU。
在使用斯隆数字天空研究项目(Sloan Digital Sky Survey)中的其他图像进行测试时,该AI在对图像进行椭圆形及螺旋星系分类,其精度达到99.8%,相比于没有使用迁移学习的神经网络,其精度有了很大提升。
该研究小组使用NVIDIA V100 Tensor Core GPU进行推理,能够在30秒内对10,000个星系进行分类。
Khan 表示:“我们已经开始正式使用该网络。后续还将在暗能量研究中使用该网络的升级版本,借助其对项目中的3亿个星系进行分类。借助于GPU加速推理,我们可以随时对所有图像进行分类。”
Khan和他的团队还开发了一项可视化技术来展示神经网络在训练过程中是如何学习的。
他表示:“即使深度学习模型可以达到令人惊叹的精度水平,但是当AI出现了错误的时候,我们通常也无法知道其出错的原因。像这样的可视化技术可以对神经网络性能进行启发式检查,这为科学界提供更多的解释依据。”
研究人员下一步计划研究星系的形态是如何随红移而变化——这是一种由宇宙膨胀引起的现象。
本文主图片来自Sloan Digital Sky Survey,由Wikimedia Commons在Creative Commons(CC BY 4.0)下授权。
在天文学研究过程中,天文学家们已经收集了数百万张图像。但随着近期关于暗能量研究和后续的关于空间及时间的研究项目的逐步开展,这一数量将呈螺旋式上升趋势,预计这些研究项目将再收集数十亿的数据。
此前,一个名为Galaxy Zoo的众包(crowdsource)项目吸引了大量的志愿者参与项目,帮助天文学家们对斯隆数字天空研究项目(Sloan Digital Sky Survey)中的100多万张星系图像进行分类。但是公众对于天体物理学的帮助所能达到的程度,也仅此而已了。
伊利诺伊大学香槟分校(the University of Illinois at Urbana-Champaign)的物理学博士Asad Khan说:“Galaxy Zoo是一次成功的尝试,但在接下来的研究当中,其收集数据的速度之快,是这种众包方法所无法满足的。这就是为什么人们需要提出新的方法,通过AI技术来推进数据驱动型发现的进程,其中就包括包括图像分类。”
借助于迁移学习技术,Khan和他的同事们利用当前流行的图像分类模型Xception开发出了一种神经网络,可以将星系图像分类为椭圆形或螺旋形星系,而且具有专家级的精度。对星系形状进行分类,可以帮助科学家们确定星系的年龄,而且还可以帮助科学家们理解更为复杂的问题,如关于暗能量和宇宙膨胀的速度。
自动化星系分类可以减少天体物理学家在标记上所花费的时间,从而将其精力投入到更为复杂的研究当中。
此研究项目是首次将深度迁移学习应用于银河系分类当中,也是SC19年度超算大会上所展示的六项科学可视化和数据分析项目之一。
AI为天文学研究提速
研究人员使用斯隆数字天空研究项目(Sloan Digital Sky Survey)中的35,000张星系图像训练该深度学习网络。借助于阿贡国家实验室(Argonne National Laboratory)的Cooley超级计算机,研究小组将神经网络训练时长从5小时加速到8分钟,该超级计算机配备了数十个NVIDIA数据中心GPU。
在使用斯隆数字天空研究项目(Sloan Digital Sky Survey)中的其他图像进行测试时,该AI在对图像进行椭圆形及螺旋星系分类,其精度达到99.8%,相比于没有使用迁移学习的神经网络,其精度有了很大提升。
该研究小组使用NVIDIA V100 Tensor Core GPU进行推理,能够在30秒内对10,000个星系进行分类。
Khan 表示:“我们已经开始正式使用该网络。后续还将在暗能量研究中使用该网络的升级版本,借助其对项目中的3亿个星系进行分类。借助于GPU加速推理,我们可以随时对所有图像进行分类。”
Khan和他的团队还开发了一项可视化技术来展示神经网络在训练过程中是如何学习的。
他表示:“即使深度学习模型可以达到令人惊叹的精度水平,但是当AI出现了错误的时候,我们通常也无法知道其出错的原因。像这样的可视化技术可以对神经网络性能进行启发式检查,这为科学界提供更多的解释依据。”
研究人员下一步计划研究星系的形态是如何随红移而变化——这是一种由宇宙膨胀引起的现象。
本文主图片来自Sloan Digital Sky Survey,由Wikimedia Commons在Creative Commons(CC BY 4.0)下授权。