基于人工智能,在大型行星研究项目中检测系外行星的一种新方法
扫描二维码
随时随地手机看文章
在过去的十年里,超过一百万颗恒星被追踪为凌日行星。开普勒和苔丝等太空任务获得或将提供的大量数据需要自动化方法来检测候选系外行星的存在。直接或间接获得的与潜在系外行星相关的数据的人工解释非常费力,并且容易出现人为错误,其结果难以量化。在大型行星研究项目中检测系外行星的一种新方法是基于人工智能。人工智能 (AI) 的目标是创建能够执行原本需要人类智能的任务的系统。
近年来,人工智能越来越受欢迎,这主要归功于机器学习的进步。机器学习旨在开发能够使用适当的算法和以前通过人类(监督学习)或自动处理的大量数据(数据集)来改进自身的系统。与机器学习相比,深度学习技术处于更高水平,主要区别在于使用神经网络,或通过模拟神经元及其之间的连接来遵循人脑行为的模型。与传输方法等传统技术相比,深度学习学习独立表征数据,而不依赖于手工编码的指标。最新的人工智能技术提供了巨大的潜力,可以帮助科学家和研究人员识别新行星并预测这些行星上存在生命的可能性。
普利茅斯大学的 Christopher Bishop 领导的一个项目使用基于人工神经网络 (ANN) 的模型将行星分为五类。对于它们中的每一个,该模型都能够估计生命的概率,并具有在未来星际探索任务中发挥关键作用的明显潜力。该团队位于普利茅斯大学机器人和神经系统中心,训练了自己的网络,根据行星与当今地球、早期地球、火星、金星或土星的相似性将行星分为五种类型。这五个天体是已知有大气层的岩石天体,因此是我们太阳系中最有可能宜居的行星之一。太阳系五颗行星的大气观测数据(称为光谱)在神经网络的输入中呈现,它被要求根据行星类型对它们进行分类。由于我们目前只有地球上存在生命形式的证据,因此该分类使用“生命概率”指标,该指标基于对五种目标类型的相对较好理解的大气和轨道特性。Bishop 使用 100 多种不同的光谱剖面对网络进行了训练,每种光谱由数百个有助于宜居性的参数组成。神经网络基于模仿生物大脑行为的模型。任何神经网络的构建块都是感知器,这是一个二元分类器,将一组输入映射到输出,对真实神经元的功能进行建模。通过将每个感知器的输出连接到另一个感知器的输入,得到一个或多或少复杂的网络,它代表了现代自动学习算法的基础。神经网络与传统的计算系统不同,传统的计算系统本质上是程序性的:每个程序从第一行代码开始,执行它,然后以线性方式按照指令移动到下一行。另一方面,神经网络不遵循线性路径,而是通过同时激活网络的多个节点(感知器或人工神经元)来并行处理信息。
图中可见的每条线代表两个人工神经元之间的连接,并指示信息是如何传递的。与神经元的每个输入连接都与一个权重相关联,该权重指示该信息对确定输出值的贡献程度。每个权重所采用的一组值决定了网络的最终输出,并在网络本身的学习阶段对其进行校准,使其经受数千个样本。通过分析开普勒太空任务收集的数据(超过 15,000 个标记数据),机器学习技术可以识别新的系外行星,特别是 Kepler-90i 和 Kepler-80g。第一个对天文学家来说至关重要,它将围绕该恒星运行的已知行星总数增加到八颗,就像在我们的太阳系中一样。由美国宇航局设计的开普勒太空望远镜提供的观测结果处于探测灵敏度的极限,该望远镜的目标是定位尺寸与地球轨道类太阳恒星相当的行星。为了准确确定这些行星的出现率,即使存在非常低的信噪比,也可以使用深度学习等自动评估技术。例如,通过适当地训练卷积神经网络 (CNN),可以预测给定信号是否对应于凌日系外行星或天体物理或仪器现象产生的误报。事实证明,这种类型的模型可以有效地根据候选者确实是系外行星的概率对它们进行排名。几乎 99% 的时间,
在最近发表的一项研究中,研究人员使用计算机模拟星系形成的数据来训练使用深度学习算法开发的神经网络。模拟的输出用于生成星系的合成图像,就像它们是由哈勃太空望远镜获得的一样。通过这些模拟图像,可以训练网络识别先前通过模拟确定的银河演化的三个关键阶段。随后,研究人员团队能够为该系统提供由哈勃望远镜获取的大量用于分类的真实图像。深度学习算法他们非常擅长识别模式,在天体物理学中,他们甚至能够识别出复杂到足以被认为超出人类能力范围的模式。
数十年前,随着 SETI 计划的启动,对地外生命形式的探索,最近集中在发现系外行星,这些行星提供可能与地球上存在的环境条件相似的环境条件,更有可能遇到外星生命的迹象。与我们类似的情报、技术和通信。在这一领域,人工智能 (AI) 正在做出重要贡献。尽管迄今为止已确认存在 4,000 多颗系外行星,并且正在评估其他许多行星,但迄今为止似乎还没有发现任何形式的外星生命。人工智能将能够提供许多答案,帮助我们发现“新的相似世界”,但距离我们的星球仅数光年。
或许有一天,人工智能也将能够回答科学界无数年来一直在问的问题:“我们在宇宙中是孤独的吗?”