HyperAI超神经

ICRA 2025 GOOSE 2D 语义分割挑战赛技术报告:利用色偏校正、RoPE-Swin 主干和基于分位数的标签去噪策略实现稳健的户外场景理解

Chih-Chung Hsu, I-Hsuan Wu, Wen-Hai Tseng, Ching-Heng Cheng, Ming-Hsuan Wu, Jin-Hui Jiang, Yu-Jou Hsiao
发布日期: 5/13/2025
ICRA 2025 GOOSE 2D 语义分割挑战赛技术报告:利用色偏校正、RoPE-Swin 主干和基于分位数的标签去噪策略实现稳健的户外场景理解
摘要

本报告介绍了由 ACVLAB 团队为 ICRA 2025 GOOSE 二维语义分割挑战赛开发的语义分割框架,该框架专注于在真实环境下将户外场景解析为九个语义类别。我们的方法集成了 Swin Transformer 主干网络,并通过旋转位置嵌入 (RoPE) 进行增强,以提升空间泛化能力,同时还集成了色偏估计与校正模块,旨在补偿自然环境中的光照不一致性。为了进一步提高训练稳定性,我们采用了基于分位数的去噪策略,降低前 2.5% 最高误差像素的权重,将其视为噪声,并在优化过程中抑制其影响。在官方 GOOSE 测试集上进行评估,我们的方法实现了 0.848 的平均交并比 (mIoU),证明了将色彩校正、位置编码和误差感知去噪相结合在稳健语义分割中的有效性。