人工智能(Artificial Intelligence,简称AI)就是用机器来模拟人类认知能力的技术,主要包括感知、学习、预测推理和决策等方面的能力。2016年3月,运用了人工智能“深度学习”技术的计算机程序AlphaGo在与围棋世界冠军李世石的对战中轻松获胜,人工智能也随之开始受到越来越多的关注。近年来,由于AI的赋能,智慧教育、智慧医疗、智慧安防、自动驾驶汽车、物联网等行业和领域获得了蓬勃发展。
(图片来自网络)
一、AI在天文数据的处理方面大显身手
由于天文技术的进步,天文学中出现了海量的数据,已经远远超过TB,达到PB的量级。天文学家们要想从LAMOST、FAST、LSST、VST、cssT等大型望远镜的海量数据中找出有价值的信息,需要耗费很多的时间和精力。高效地处理这些数据,已经成了天文学家们面临的一道难题。于是,由于其在海量数据分析和处理方面所具有的突出优势,人工智能很自然地走入了天文学家的视野。
2017年,NASA宣布他们利用google AI发现了“第二个太阳系”,而且所处天体是我们所在的太阳系之外首个已知的八行星恒星系统。人工智能手段参与系外行星的搜寻,并且首次为人类找出此前被遗漏的行星,人工智能方法体现出来的效率和准确性远超传统的分析方法。
二、引力透镜——宇宙中的“放大镜”
顾名思义,引力透镜就是由引力引起的透镜效应,它是宇宙中天然的“放大镜”,可以让我们看清遥远的天体。引力透镜的概念最初是在爱因斯坦的广义相对论中提出的,它是指一种大质量物体改变其周围时空特性,从而使光线在其附近传播时路径发生弯折的现象。
1979年,三位天文学家Walsh,Carswell和Weymann发现有两颗类星体离得非常近,通过测量它们的光谱,三位科学家证实这两个图像是来自同一天体。从此以后,引力透镜才真正被天文学家们所广泛接受,今天已经成为天文学中的一项重要工具。
在引力透镜事件中,观测者从地球上观测非常遥远的发光天体,或者说背景天体,在观测者和背景天体中间还有一个处于中间位置的天体,在中间的这个天体质量要足够大,而且恰好处在观测者和背景天体的连线附近。这样背景天体发出的光在经过中间天体附近的时候,传播路径在中间天体引力场的作用下发生偏折,就像我们拿着放大镜看遥远的背景天体一样。
天文学上研究引力透镜一般分为三个大的方向:一是强引力透镜,当这三者比较好的处在一条直线上;二是弱引力透镜,就是这三者没有特别好的连在一条直线上;三是微引力透镜,主要是研究这三者在视觉上有明显相对运动的情况。
弱引力透镜在宇宙天空中几乎无处不在。而强透镜和微透镜就是非常稀少的事件了。星系和星系团的引力场可以造成非常强的折射,因此我们可以看到背景天体发生非常明显的形变。比如背景天体是一个星系的话,我们可能看到它被扭曲成一条弧形甚至一个完整的圆环(爱因斯坦光环);如果背景天体是致密的点源,比如类星体的话,我们可能看到它的两个像,甚至四个像(爱因斯坦十字)。这就是强引力透镜现象。
强引力透镜示意图(图片来自网络)
爱因斯坦光环(图片来源:NASA/ESA)
爱因斯坦十字(图片来源:NASA/ESA)
三、AI助力搜寻强引力透镜候选体
星系尺度的强引力透镜系统是重要的宇宙学探针,可用于深入地研究宇宙学和天体物理中的诸多科学问题,如暗物质性质、星系形成和演化以及哈勃常数的测量等。然而,目前已证认的强透镜系统数目过少,严重制约了相关天体物理学问题研究的开展。
如何搜寻证认更多强透镜样本是当前研究中的一个主要问题。通过下一代大规模测光巡天项目的开展,我们有望发现数以万计的强透镜系统。但如何才能在海量的天体图像中快速地找到强透镜候选体呢?近期,中国科学院云南天文台与云南大学西南天文研究所的研究人员合作构建并训练了一个卷积神经网络,用来寻找强引力透镜系统。
该神经网络被应用于欧洲南方天文台2.6米巡天望远镜(VST)千平方度巡天(Kilo-Degree Survey—KiDS)数据,发现了38个新的强透镜候选体。论文发表在英国《皇家天文学会月刊》上。
发现的38个强透镜候选体中的4个(图片来源:KiDS巡天)
四、AI如何帮助搜寻强透镜候选体?
卷积神经网络是AI领域的重要技术,它的广泛应用是近年来AI迅速发展的关键之一。相比普通神经网络,卷积神经网络可以充分提取数据中的空间不变性特征,多层卷积可以实现从底层特征到高层特征的复合。卷积神经网络这些特点非常有利于引力透镜的识别。
由于引力透镜的特殊性,神经网络的泛化能力十分重要,为此,该网络训练有别于一般网络,主要使用天文学家根据理论模型生产的模拟数据进行训练,由于模拟数据包含了天文工作者多年的经验,并且可以任意生成,多样性和全面性远大于人工标注数据,结合定制的训练方法,该神经网络的泛化能力得到了极大提高。
为了方便天文工作者使用和改进该网络,新型科学计算语言Julia被用来构建神经网络模型。相比C/C++或Python语言,Julia语言同时兼顾了速度和灵活性。由于其灵活性,研究人员很方便地定制了适合引力透镜数据特点的小型网络,有效地抑制了过拟合现象。
最终,该网络在CPU和GPU上都表现出良好的性能,并且可以任意切换,在普通PC上就可以运行,不需要依赖大型GPU集群,非常有利于天文研究工作者实时修改、训练和测试网络。
有意思的是,研究人员发现,在训练计算机时,非强透镜图像比强透镜图像更加重要。刚开始他们使用简单的规则星系图像作为非强透镜训练样本,发现结果正确率非常低。最后把各种可能的非透镜图像都考虑进来之后,才得到了比较好的结果。这就像在教电脑认识什么是狗的时候,还要告诉它猫、羊、牛等等都不是狗。而如果你只告诉它猫不是狗,电脑有非常大的概率把羊和牛认成狗。
五、AI可以成为天文学家有力的臂膀
卷积神经网络可以充分利用GPU进行并行加速,因此,通过装备更多或更强的GPU,可以极大地提升数据的搜索速度和效率,无需惧怕更大数量级的天文数据。
由于人工智能的帮助,天文研究者得以从数据处理和分析的泥沼中解脱出来,将更多的时间和精力用于思考和探寻宇宙本身的奥秘。
来源:中国科学院云南天文台