中国科学家研发多模态神经网络,高效精准分类数千万天体目标
在现代天文研究中,了解宇宙结构、星系演化和暗物质分布的关键在于准确识别天体类型。传统方法主要依赖光谱观测,但由于资源有限,大规模巡天无法全面覆盖所有天体的光谱数据,导致许多天体未被精确分类。相比之下,图像观测速度快,能够覆盖更广泛的天区,并探测到更暗淡的天体,但单独使用图像或SED(多波段能谱)特征进行分类时,存在较高的简并性问题,例如高红移类星体和恒星在图像中容易被误认为点源,而不同类型天体在颜色空间中也可能重叠。 为解决这一问题,中国科学院云南天文台的封海成博士与中国郑州大学的李瑞博士、意大利那不勒斯费德里科二世大学的Nicola R. Napolitano教授合作,开发了一种多模态神经网络模型。该模型创新性地结合了天体的形态特征和SED信息,大大提高了分类的准确性。通过利用欧洲南方天文台千平方度巡天项目(KiDS)第五次数据发布的1350平方度天区中的数据,研究人员成功分类了超过2700万个r波段亮度高于23等的天体,实现了对恒星、类星体和星系等多种天体的高精度自动识别。 封海成团队的方法对于即将到来的大规模多波段巡天项目,如中国空间站巡天望远镜,具有重要意义。这些项目预计会产生数十亿条天体观测数据,传统的手动分类方法显然难以应对如此庞大的数据量。而基于深度学习的多模态方法不仅可以提高分类速度,还能确保数据的准确性和可靠性。此外,团队还计划在未来进一步优化模型,使其能够处理更多类型的数据,从而推动天文数据处理技术从“量”向“智”的转变,为构建高质量的天文数据库和揭示宇宙演化的奥秘打下坚实的基石。 此次研究成果以《基于神经网络的KiDS DR5源形态-光谱分类:综合的恒星-类星体-星系目录》为题,发表在权威的《天体物理学报增刊》上,受到了业内广泛的关注和认可。业内专家认为,封海成团队的研究不仅解决了长期以来天体分类中的瓶颈问题,还为未来的天文大数据分析提供了重要的技术范例。中国科学院云南天文台作为中国顶尖的天文研究机构,一直致力于推进天文学的发展,这次的合作成果再次体现了其在国际天文学领域的领先地位。