Command Palette
Search for a command to run...
StreakMind:利用自动化数据库集成进行天文图像中卫星条纹的AI检测与分析
StreakMind:利用自动化数据库集成进行天文图像中卫星条纹的AI检测与分析
Rafael Carrillo René Duffard Pablo García-Martín Javier Romero Nicolás Morales Luis Gonçalves
摘要
人造卫星和空间碎片对天文图像的污染日益严重,不仅干扰科学巡天观测,还产生了大量带有拖尾痕迹的曝光图像。随着数据量的激增,人工逐张检查已不再具有可行性,因此,实现对拖尾痕迹的可靠识别与特征提取,已成为数据质量控制及近地轨道物体监测的关键环节。本文提出了一种名为 StreakMind 的自动化流程(pipeline),旨在检测天文图像中的近地天体(NEOs)和卫星拖尾,提取其几何特征,并与已知的轨道物体进行交叉匹配(cross-identification)。该系统将所有推理结果整合至结构化数据库中,适用于大规模巡天项目。我们基于包含 2335 张图像的混合人工与合成数据集,训练了一个 YOLO-OBB 模型,用于检测经过处理的 FITS 帧中的拖尾痕迹。随后,通过几何优化、帧间关联、卫星交叉识别以及基于高斯分布的置信度评分,生成最终识别结果,并存储于标准化的关系型数据库中。本研究利用拉萨格拉天文台(L98)搭载 Celestron C14+Fastar 望远镜获取的图像,对自动化的拖尾检测与特征提取方法进行了开发与测试。在测试集上,该模型实现了 94% 的精确率(precision)和 97% 的召回率(recall)。
一句话总结
StreakMind 是一个自动化流程,采用在包含 2335 张图像的混合人工 - 合成数据集上训练的 YOLO-OBB 模型,用于检测和处理后的 FITS 帧中的卫星条纹和近地天体,应用几何细化、帧间关联和基于高斯的置信度评分,将交叉识别结果存储在规范化关系数据库中,在测试集上实现了 94% 的精确率和 97% 的召回率。
核心贡献
- 本工作提出了 StreakMind,这是一个端到端流程,旨在检测地基天文图像中的线性条纹并细化连续帧中的几何结构。该系统将测量标准化为小行星中心 (MPC) 风格的记录,并使用外部星历交叉识别候选人造物体,将所有输出集成到关系数据库中。
- 检测依赖于在包含 2335 张图像的混合人工 - 合成数据集上训练的 YOLO-OBB 模型,以识别处理后的 FITS 帧中的条纹。随后应用几何细化、帧间关联和基于高斯的置信度评分以生成最终识别结果。
- 测试使用了在拉萨格拉天文台 (L98) 使用 Celestron C14+Fastar 望远镜获取的图像,以验证自动检测方法。测试集结果表明,检测模型的精确率为 94%,召回率为 97%。
引言
现代天文调查产生了大量的图像,其中人造卫星和空间碎片产生的条纹会掩盖近地天体等科学目标,因此需要自动质量控制和空间态势感知。传统方法如霍夫变换或人工检查无法处理现代高时间分辨率图像的规模,现有的机器学习解决方案往往缺乏用于交叉识别和数据库管理的端到端集成。作者提出了 StreakMind,这是一个利用 YOLO-OBB 模型检测和分析天文图像中线性条纹的端到端流程。该系统细化几何测量,关联跨帧检测,并在将标准化记录存储到关系数据库之前将发现与外部星历进行交叉引用。
数据集
-
数据集组成和来源
- 作者结合真实天文观测与合成生成数据来训练 StreakMind 流程。
- 真实图像源自拉萨格拉天文台,使用 Celestron C14+Fastar 反射镜和 SBIG ST-10 3 CCD 相机。
- 数据集包含 2055 张校准后的 FITS 图像,拍摄于 2019 年 4 月至 6 月之间,曝光时间从 8 秒到 120 秒不等。
- 合成数据包含 280 张额外图像,其中线性特征被注入到真实背景中,以解决类别不平衡问题。
-
每个子集的关键细节
- 真实图像分辨率为 1092 乘 736 像素,并经过人工检查以识别 765 条线性条纹。
- 条纹根据长度分类,使用从分布的第 75 百分位数得出的 269.1 像素阈值。
- 真实子集包含 1523 张无条纹图像,412 张短条纹图像和 120 张长条纹图像。
- 合成图像仅引入长条纹,其中 69% 跨越全图像宽度,31% 保留在视场内。
- 合成条纹的方向遵循高斯分布,其中 70% 位于 -60 到 60 度之间。
-
模型训练和数据使用
- 作者采用分层采样策略,以确保训练、验证和测试集之间的代表性分布。
- 最终划分将 70% 的图像分配给训练,20% 给验证,10% 给测试。
- 训练集最初包含 1438 张真实图像,随后通过增强提高了长条纹的表示。
- 合成数据集成平衡了短条纹和长条纹类别的频率,以减轻过拟合偏差。
-
处理和元数据构建
- FITS 文件使用 ZScale 归一化转换为 PNG 格式,以增强对比度同时保留像素网格。
- 转换过程中对 y 坐标应用垂直翻转,以将 FITS 天体测量参考与标准光栅图像惯例对齐。
- 定向边界框由条纹端点构建,带有固定边距以保留空间范围和方向。
- 元数据记录包括天文台代码、望远镜详情、天体测量坐标以及基于 40 像素边缘边距阈值的完整性状态。
- 标准化记录遵循 MPC 格式,以便于直接摄入检测数据库。
方法
提出的流程 StreakMind 采用深度学习骨干网络进行初始检测,随后进行一系列几何和光度细化阶段。核心检测引擎利用预训练的 YOLO11 模型,专门配置用于定向边界框 (OBB),该模型最初在 DOTAv1.0 数据集上训练,随后在增强后的天文数据集上微调。该单阶段检测器在一次通过中预测物体的位置和类别,输出由四个角点定义的 OBB。
参考下方的几何定义以了解这些检测的参数化:

在此表示中,每个检测以其中心 C、长轴长度 L、宽度 w 和相对于图像轴线的方向角 θ 为特征,顶点标记为 v1 到 v4。在初始检测之后,流程实施多阶段细化过程。首先,通过与 Gaia DR3 星表交叉匹配检测,抑制由恒星衍射尖峰引起的假阳性。接下来,光度预分析纵向扩展 OBB,以更好地捕捉回归器可能低估的微弱条纹的真实范围。这是通过沿长轴采样通量分布 I(s) 并扩展端点直到信号低于定义为 I(s)>Ibg+kσ 的动态阈值来实现的。
随后,通过使用凝聚层次聚类将细化 OBB 的四个角顶点聚类为两组来估计条纹的端点。这些聚类的质心为条纹端点和中心提供稳定的估计。最后,流程执行几何外推和帧间关联以链接连续图像中的检测。这涉及基于标记在曝光时间内的位移计算像素速度,定义为 v=texpΔm。这些速度用于将标记向前或向后投影以匹配后续帧中的候选对象,确保即使物体暂时缺失也能维持轨迹。处理后的数据随后与卫星星历交叉识别并导出到结构化数据库。
实验
评估结合了在保留测试集上的定量分析和定性视觉检查,以验证受控和真实天文条件下的检测准确性。与人工检查的比较表明,自动流程在可扩展性、对微弱特征的敏感性和即时数据库集成方面具有显著优势,尽管几何精度需要针对非常长的条纹进行特定的后处理。总体而言,结果证实了端到端检测系统的可行性,该系统保持稳健性能,并通过迁移学习支持未来扩展到不同的天文台。
数据集组织为训练、验证和测试子集,样本分类为长条纹、短条纹或无条纹图像。这些类别的分布在所有三个子集中非常一致,表明划分具有代表性。无条纹类别代表数据的大多数,而条纹类别形成少数。数据集划分为训练、验证和测试子集,类别比例一致。无条纹类别在所有子集中都是主导类别。条纹实例分为长和短类别,频率相当。
该表显示了不同百分位数上的像素条纹长度分布,表明检测到的物体大小变化很大,从短片段到显著更长的特征。作者指出,模型对于跨度约为图像宽度一半的条纹保持了稳健的几何精度。虽然检测对于非常长的条纹保持稳定,但文本表明在此模式下位置精度略有降低,需要专用的光度后处理。模型实现了高检测精度,在测试集上精确率和召回率超过 90%。几何重建对于中等条纹长度可靠,但对于非常长的特征需要额外调整。自动流程与传统人工检查方法相比提供了更好的可扩展性和灵敏度。
该表展示了用于模型开发的数据集组成,分为训练、验证和测试子集。在所有子集中,类别分布保持一致,其中不包含条纹的图像形成最大的组。短条纹比长条纹更常见,长条纹构成最小的类别。数据集划分为训练、验证和测试集,类别比率一致。没有条纹的图像在每个子集中都形成大多数类别。短条纹比长条纹更频繁。
评估采用划分为训练、验证和测试子集的数据集,类别分布一致,其中没有条纹的图像形成大多数。实验表明,模型实现了高检测精度和可靠的几何重建,适用于中等条纹长度,尽管对于需要后续调整的非常长特征,位置精度略有下降。总体而言,自动流程证明在可扩展性和灵敏度方面优于传统人工检查方法。