2 个月前

FishSegSSL:一种用于鱼眼图像的半监督语义分割框架

{Nizar Bouguila, Zachary Patterson, Sneha Paul}
FishSegSSL:一种用于鱼眼图像的半监督语义分割框架
摘要

配备鱼眼镜头的大视场(Field-of-View, FoV)相机在诸多现实世界的计算机视觉应用中展现出显著优势,尤其在自动驾驶领域。尽管深度学习在传统基于标准透视图像的计算机视觉任务中已取得成功,但由于缺乏适用于完全监督学习的高质量数据集,其在鱼眼相机场景下的潜力仍鲜有探索。半监督学习为应对这一挑战提供了潜在解决方案。在本研究中,我们从透视图像领域出发,系统地探索并基准测试了两种主流的半监督学习方法在鱼眼图像语义分割任务中的表现。此外,我们提出了一种全新的鱼眼图像分割框架——FishSegSSL,该框架包含三个创新的半监督组件:伪标签过滤、动态置信度阈值机制以及鲁棒性强的数据增强策略。在基于车载鱼眼相机采集的WoodScape数据集上的实验结果表明,与使用相同数量标注数据的完全监督方法相比,所提方法可将模型性能提升最高达10.49%;同时,相较于现有图像分割方法,性能亦提升了2.34%。据我们所知,这是首个针对鱼眼图像进行半监督语义分割的研究工作。此外,本文还开展了全面的消融实验与敏感性分析,充分验证了所提出各项技术组件的有效性与贡献。