绿岸射电天文望远镜是寻找外星文明的几个望远镜之一。图片来源:Jim West/Alamy
从美国西弗吉尼亚的山丘到澳大利亚乡村的平原,一些全球最大的望远镜正在聆听来自遥远外星文明的信号。搜寻地外文明(SETI)是一项寻找人造电磁辐射的计划。
一项1月30日发表于《自然-天文学》的研究描述了如何利用机器学习——人工智能(AI)的一个子集——帮助天文学家快速筛选此类搜索产生的大量数据。
“机器学习技术让SETI研究进入了一个新时代。”美国SETI研究所的行星天文学家Franck Marchis说。
对于SETI来说,大数据是个相对较新的问题。几十年来,由于几乎没有任何积累的数据,该领域的发展受到限制。
天文学家Frank Drake于1960年开创了SETI的先河,但随后进行的SETI搜索大多局限于少数恒星。
2015年,俄罗斯亿万富翁Yuri Milner在加州伯克利资助了史上最大的SETI项目——“突破聆听”。该项目旨在寻找100万颗恒星上的智慧生命迹象。研究人员利用西弗吉尼亚州、澳大利亚和南非的望远镜,寻找来自恒星且频率稳定变化的无线电波。
麻烦的是,这些搜索产生了大量数据,其中包括来自手机、GPS和现代生活其他方面因干扰产生的误报。
SETI研究所的天文学家Sofia Sheikh说:“对我们来说,寻找SETI信号时最大的挑战不是获得数据,而是区分人类或地球技术的信号与从银河系其他地方找到的信号。”
手动查看数以百万计的观测数据结果是不切实际的。一种常见的方法是用算法锁定与天文学家认为可能的外星信号相匹配的信号。但这些方法可能会忽略与天文学家预期略有不同的潜在信号。
机器学习算法在大量数据的基础上进行训练,可以学习识别地球干扰的特征,因此非常擅长滤除噪声。论文主要作者、加拿大多伦多大学数学家和物理学家Peter Ma表示,机器学习还擅长捕捉不属于传统类别的外星信号,这些信号可能被遗漏了。
Ma和同事通过“突破聆听”项目对820颗恒星的观测结果进行了筛选,后者是利用位于西弗吉尼亚的绿岸射电天文望远镜观测到的。他们建立了机器学习软件来分析数据,其中收集的近300万个感兴趣的信号中大部分被放弃了,因为它们是来自地球的干扰信号。
之后,Ma手动审查了大约2万个信号,并缩小到8个有趣的候选信号。然而,最终却一无所获——团队第二次聆听时,所有8个信号都消失了。尽管如此,他们建立的方法仍可用于其他数据,如南非MeerKAT望远镜的大量观测结果;也可以用于存档的SETI数据,以寻找以前可能被忽视的信号。
此外,机器学习也是这个月即将启动的另一项SETI计划的核心,人工智能还可以在SETI过程的其他阶段提供帮助。
目前,SETI可能会继续使用经典和机器学习混合的方法整理数据。(来源:中国科学报 王方)
相关论文信息:https://doi.org/10.1038/s41550-022-01872-z