看人工智能如何发现夜空中新的恒星、新的地外行星甚至暗物质

近几年，人工智能越来越多应用于天文学研究。深度学习需要海量数据，而天文学正是AI大显身手的领域。机器可以替人类从茫茫大海里捞针，捕捉到新的恒星、新的地外行星甚至暗物质。　　寻找暗物质，机器比人的眼神好。近期《计算天体物理学和宇宙学》发表的一篇论文显示，美国劳伦兹伯克利国家实验室(以下简称“伯克利实验室”)等机构共同研制的深度学习AI框架，能够探寻宇宙里暗物质的迹象。

辨认“引力透镜”，AI立功了

寻找“引力透镜”是研究暗物质分布的基本方法。巨大质量的物体会像透镜一样扭曲路过的光线，找出这种扭曲就能捕捉到不发光的质量物。

论文显示，伯克利实验室建立的深度学习AI框架CosmoGAN，可以分析引力透镜与暗物质的关联。它可以创建高保真、弱引力透镜收敛图。

曾几何时，寻找“引力透镜”所需的模拟和数据处理很麻烦。20名科学家花费了好几个月的时间只能查看一小块空间图像。物理模拟需要数十亿个计算小时，占用数兆字节的磁盘空间。

神经网络的进步提供了机会。伯克利实验室领导的团队引入一种“生成性对抗网络(GANs)”。研究者穆斯塔法说：“也有别的深度学习方法可以从许多图像中得到收敛图，但与竞争方法相比，GANs生成非常高分辨率的图像，同时仍有神经网络的高效率。”

现在，天文学家可以用CosmoGAN分析大得多的天区，速度也更快。

CosmoGAN不是唯一取得进展的天文学深度学习神经网络。比如多伦多大学利用深度学习技术解析月球陨石坑的卫星图像，P8超级计算机的神经网络在仅仅几个小时内发现6000个新的陨石坑，是过去几十年中人类发现陨石坑数量的2倍。伊利诺伊大学厄巴纳-香槟分校利用深度学习来探测和分析黑洞碰撞的引力波。AI在天文学遍地开花。

数据太多，没机器玩不转

过去几年里，天文领域的大多数方向都在尝试使用人工智能。考虑到天文学要处理的数据之多，这是一个很自然的思路。让机器练习去分析蛛丝马迹，不如此，未来的天文学将无法运转。

不久前举办的2019年GPU技术大会吸引了全世界的人工智能学者。大会请来加州大学圣克鲁兹分校的天文学家布兰特·罗伯特森演讲，他指出：“天文学正在一场新的数据革命的风口”。罗伯特森认为，新一代天文仪器必须配合由深度学习驱动的新一代软件。

比如预计在3年后运行的大口径全天巡视望远镜(LSST)。它巡视南天那一半宇宙中的370亿个星系，生成一部时长十年的不间断视频。LSST配备的是32亿像素的相机，每晚产生25TB的数据，相当于现在先进天文望远镜一生贡献的所有数据。

再比如平方公里阵列射电望远镜(SKA)。它遍布全球，一部分天线在非洲南部8国部署，还有100多万天线位于澳大利亚和新西兰。它的原始数据每天达到5千个PB，处理后也有50个PB左右。

“暗能量巡天”编制几亿个星系的星图;“盖亚”卫星测绘银河系数十亿恒星;“兹威基”项目每小时能够扫描3750平方度的天区。在中国，FAST每天的数据量将达150TB;郭守敬望远镜观测了901万条光谱，是世界上最大的天体光谱库……

捕捉人类看不出的模式

数据越来越多，科学家试图聚合它们。但在GPU大会上，罗伯特森说，未来几个大型天文望远镜一起产生大量数据，聚合之后复杂到人类无法直接利用。而加州大学圣克鲁斯分校的科学家试图解决这个问题。计算机科学系一名博士生创建的Morpheus深度学习框架，可以基于望远镜的原始数据，逐像素地分类天体。

加州大学圣克鲁兹分校的科学家们还用AI更好地研究星系的形成。在他们2019年初发表的一项研究中，科学家用计算机模拟的星系训练计算机，让它学习星系演化的三个关键阶段。后来计算机分析来自哈勃太空望远镜的星系图像，表现出奇好。

人工智能应用于人脸识别，在海量数据训练后，可以根据一张照片，认出这个人化妆和年老时候的样子。而宇宙中很多图像也可用同样的方法来归类。

“深度学习可以寻找模式，机器能看到非常复杂的模式，而人类看不到。”参与研究的科学家大卫·库说，“我们希望进一步测试这种方法。在概念验证研究中，机器似乎成功地在数据中找到了模拟中确定的星系演化的不同阶段。”

帮天文学家找到另一个太阳系

2018年底的一篇报道显示，谷歌人工智能发力，从开普勒系外行星观测数据库里找到了新的行星。行星是很难寻找的。位于太空的开普勒卫星观察145000颗类似太阳的恒星，从恒星亮度微弱变化来发现行星。记录4年的数据中，包括大约35000个疑似的行星记录。天文学家用机器结合人眼来识别，但最暗最弱的信号常被忽略。

在谷歌AI的帮助下，我们发现了开普勒90i和开普勒80g两颗新行星。也让开普勒90被确认为第一个至少拥有8颗行星的外星系。

神经网络和机器学习处理了140亿个数据点，之后成功筛选出了候选者。

NASA和谷歌说，未来新技术将找到更多系外行星。NASA还表示不用担心天文学家失业。NASA的科学家杰西·道特森解释表示，数据提供给神经网络之前，需要天文学家进行分类，以便人工智能可以从中学习分析出新的信息。

道特森说：“AI以后绝对会和天文学家一起工作，成为必不可少的工具。”

当然，机器学习也带来“黑盒子”风险：我们得到了答案，但我们不知道机器为何如此判断，或许答案是错的。机器也会犯错。天文学家将继续训练和适应它。

延伸阅读

专家点评

深度学习还不具备“物理直觉”

确实，现在人工智能已经深入到了天文天体物理学的各个分支领域。目前，美国劳伦兹伯克利国家实验室利用深度学习，能够快速根据宇宙三维密度分布，判断暗物质、暗能量等宇宙学基本常数，他们发现应用人工智能之后，统计量误差比先前应用传统统计学办法小不少。此外，我们也利用深度学习在极低信噪比的光谱中寻找宇宙早期的氢、碳元素，发现比传统方法也要好用。

同时，天文学家们也在应用深度学习，帮助我们判断天体的三维位置、远近，进而勾勒出三维空间的大尺度结构。人们发现深度学习在对数据信息的挖掘方面，可能强于我们之前所用的传统方法。人工智能也被谷歌公司应用到探测系外行星的领域，并成功探测到了几个系外行星……可以说，人工智能如今在天体物理的前沿领域被广泛应用。

但从物理学家的角度看，基于深度学习的人工智能也许也有其局限性。这种局限性在于它只能基于数据、在已经被定义得非常明确的特定领域内发挥作用。只能在物理学家的指导下，把统计量的误差棒做得更小，估计某个量更精准，而目前尚无法指导我们发现数据背后的新物理规律。也不具备人类才有的，基于美、对称和简洁的“物理直觉”。

举一个最简单的例子，比如说开普勒基于第谷的观测数据，可以发现开普勒第三定律，而目前再好的机器学习、人工智能算法可能也很难基于相同数据，重复这个发现。

所以说我认为深度学习在天文中应用的本质，目前还局限在做更好的统计和拟合这个方面。