日冕物质抛射(简称 CME)是从太阳抛入行星际空间的大尺度等离子体团,是太阳释放能量的一种形式,也是影响空间天气的主要因素之一。大型日冕物质抛射事件会影响通信、导航、航空活动、电网运行等,为了避免安全威胁和资产损失,准确判断日冕物质抛射会「撞上」还是「错过」地球,以及预测日冕物质抛射到达的时间,其相关研究至关重要。
根据搭载于太阳与日光层观测台 (SOHO) 卫星上的 LASCO 日冕仪的数据,NASA CDAW 数据中心的研究人员手工整理了 1996 年至今的 CME 观测目录,该目录记载了每一次 CME 事件的时间、位置角、角宽度、速度等物理量,给 CME 的相关研究提供了重要的基础数据。然而,面对海量的数据,手工识别存在着耗时费力的缺点,CME 的自动识别成为该领域内较为活跃的研究方向。
来自中国科学院国家空间科学中心太阳活动与空间天气重点实验室的研究团队在《天体物理学杂志增刊系列》(The Astrophysical Journal Supplemental Series) 上发表了题为「An Algorithm for the Determination of Coronal Mass Ejection Kinematic Parameters Based on Machine Learning」的论文。论文提出了一种基于机器学习的 CME 识别与参数获取方法。与 CME 手工目录以及部分经典自动识别方法相比,该方法效率高、速度快,能够识别较为微弱的 CME 信号,并给出准确的 CME 形态信息。
研究亮点:
* 基于机器学习的 CME 识别与参数自动获取方法的效率高、速度快,能够识别较为微弱的 CME 信号
* 该方法获取的参数接近人类手工识别的结果
* 该方法探测到的 CME 结构还可用于 CME 到达时间预测、 CME 三维重构等其他方面的工作中
论文地址:
https://iopscience.iop.org/article/10.3847/1538-4365/ad2dea
关注公众号,后台回复「日冕物质抛射」获取完整 PDF
研究人员从 CDAW CME 目录网站获取了 CME 的相关事件记录 (包括 CME 出现、结束的时间以及备注),并下载了 2013 年至 2018 年 LASCO C2 和 C3 日冕仪的每日运行差分图像。选取的时间范围涵盖了第 24 太阳周期的一半,可以提供从太阳活动极大期到太阳活动极小期内,具有代表性和平衡性的 CME 和非 CME 样本。此外,第 24 太阳周期其余时间的数据被保留用于验证。
研究人员选择 NASA/CDAW 网站作为数据来源,因为它提供的数据满足了训练 CNN 模型进行图像分类以及进一步跟踪 CME 特征的需要。
根据每个 CME 事件的记录,研究人员对每张图像执行迭代 (iteration)——如果图像的曝光时间介于记录条目的出现时间和结束时间之间,则该图像会标有该条目的相应备注;相反,如果图像的曝光时间与任何记录都不匹配,则将图像标记为「No-CME」。
基于机器学习的 CME 识别与参数获取方法共分为 3 个步骤:
首先,在图像被正确分类以后,研究人员从神经网络的最后一层卷积层提取卷积特征映射,并对特征图应用 PCA 算法 (principal component analysis) 以获得同一对象的信息,然后使用 Otsu 算法(一种确定图像二值化分割阈值的算法)和形态学运算来获得精确的 CME 像素标记。
其次,扫描图像序列的每一帧,使用轨迹匹配算法来跟踪日冕仪视场中 CME 离开太阳的传播轨迹。
最后,基于上一步骤得到的轨迹,推导出 CME 的运动学参数,例如速度、 CPA (central position angle) 和 AW (angular width) 。
为了评估该方法在实际观测中的性能,研究人员选择了 2010-2012 年间具有不同速度和 AW 的代表性事件,并按 AW 的升序进行了分析。所选日冕物质抛射的 AW 范围为 78° 至 360°,速度范围为 288—1205km s-1 。同时,研究人员将其新提出方法的结果与其它经典的 CME 自动跟踪目录(即 CACTus 、 CORIMP 和 SEEDS)进行比较。
事件 1:2012 年 2 月 14 日发生的 CME 事件。
日冕物质抛射事件于 2012 年 2 月 14 日从日冕仪视场西侧发射。下图从上到下分别显示了 CACTus 、 CORIMP 、 SEEDS 和本研究提出的方法的检测图。
在上图前三行中,检测到的 CME 区域以不同的颜色和符号显示。在 CACTus 的检测图中,检测到的 CME 区域受到白色直线的限制。在 CORIMP 的检测图中,红点表示最强最外层前沿的轨迹,黄点表示整体检测到的结构。在 SEEDS 的检测图中,蓝点表示前缘的位置,红点表示使用分割技术创建的前缘的近似轮廓。在最后一行为本研究提出的方法,图中的蓝色表示不相关的背景,而较暖的颜色表示该像素更有可能是 CME 的一部分。
在西北象限,本研究的检测结果呈现出较亮的线条和斑点,这些是仅使用本研究提出的方法才能检测到小而微弱的瞬时喷发痕迹,表明了其检测小而微弱信号的能力。
事件 2:2012 年 1 月 15 日发生的 CME 事件。
研究人员从 CACTus 、 CORIMP 、 SEEDS 和新提出方法的检测结果中,从上到下分别选择并显示几帧进行比较。
所有方法都检测到了 CME 的主体,但本研究所提出的方法发现了除主体之外的较弱或较小的 CME 特征,而其他方法未能检测到它们。从上图可以看到新提出的方法成功地将 CME 区域与背景分开。
事件 3:2011 年 3 月 8 日发生的 CME 事件。
本次 CME 事件发生于 2011 年 3 月 8 日, CACTus 、 CORIMP 、 SEEDS 和本研究提出的方法的检测图如下所示:
在这些方法中,本研究所提出的方法和 CORIMP 是最早检测到 CME 的,在 04:00,而其他方法在 12 分钟后才识别出 CME 。
综合以上结果,我们能得出结论:与 CME 手工目录以及部分经典自动识别方法相比,本研究提出的基于机器学习的 CME 识别与参数自动获取方法的效率高、速度快,能够识别较为微弱的 CME 信号,给出准确的 CME 形态信息。其跟踪方法比较贴合直观,获取得到的参数接近人类手工识别的结果。此外,该方法探测到的 CME 结构还可用于 CME 到达时间预测、 CME 三维重构等其他方面的工作中。
近年来,随着技术日益进步,天体物理学研究中产生了海量数据。例如,除了前文提及的 CME 相关研究外,著名的斯隆巡天 (The Sloan Digital Sky Survey) 开始于 2000 年,观测到了约 300 万个天体,数据量大约是 40 TB 。而目前正在运行的暗能量巡天 (The Dark Energy Survey),其第一批释放的科学级光谱数据量为 80 TB,几乎与以往完成的巡天观测的整个项目数据量相当。
天文学家要想从大型综合巡天望远镜或是观测仪中获取的海量数据中,找出有价值的信息进行研究,无异于从宇宙中捞星星。如何高效地处理这些数据,已成为现代天文学面临的一项重要挑战。由于人工智能在海量数据分析和处理方面所具有的突出优势,它也很自然地走入了天文学家的视野,成为帮其「减负」的得力助手。
早在 2017 年,美国宇航局 (NASA) 就宣布,谷歌公司人工智能团队开发的神经网络已经发现了两颗新的系外行星。其中一颗行星编号为「开普勒-90i」,其所在的恒星系有 8 颗行星,该恒星系的行星数与太阳系的行星数相同。但开普勒 -90i 行星比地球大 30%,属于超级地球。
在 2021 世界人工智能大会上,腾讯公司董事会主席马化腾透露,腾讯将和国家天文台联合启动「探星计划」,将 AI 技术用于寻找脉冲星,探索宇宙。双方将基于腾讯优图实验室领先的计算机视觉技术、腾讯云的计算能力,用「云+AI」帮助中国天眼 FAST 处理每天接收到的庞大数据,并通过视觉 AI 分析找到脉冲星线索,辅助快速射电暴和近密双星系统中脉冲星搜索。
2022 年 6 月,葡萄牙研究人员开发出人工智能软件 SHEEP,来自动识别观测目标是恒星、星系、类星体、超新星还是星云。与其他模式识别软件不同,SHEEP 软件首先计算红移数据作为分类模式的附加特征,再通过观测图像与坐标数据相结合,对编目天体进行分类。相关成果发表在《天文学与天体物理学》刊物上。
如今,越来越多的科研人员正将 AI 技术作为一种强大的探索工具,提供丰富而复杂的数据、分类星系、筛选数据以获取信号、发现脉冲星、识别不寻常的系外行星等,从而助推天文学领域革新,毫无疑问 AI 将激发新活力、创造新可能。
参考资料:
1.https://iopscience.iop.org/article/10.3847/1538-4365/ad2dea
2.https://mp.weixin.qq.com/s/7frn8XvRJ-QWHCFwtsixzw
3.http://www.stdaily.com/index/kejixinwen/202207/d42b187caded4c7db61582566d7a6ce6.shtml
4.https://www.most.gov.cn/gnwkjdt/202206/t20220624_181299.html