
摘要
大多数关于语义分割的研究进展都是基于在良好光照条件下拍摄的白天图像。相比之下,我们研究了夜间图像的语义分割问题,并通过不使用夜间注释来改进现有方法,从而达到新的技术水平。此外,我们设计了一个新的评估框架,以应对夜间图像中语义的显著不确定性。我们的主要贡献包括:一种课程框架,通过标记的合成图像和未标记的真实图像逐步将语义分割模型从白天适应到夜晚,这些图像涵盖了逐渐变暗的时间段。该框架利用真实图像在不同时间段之间的对应关系来指导其标签的推断;一种新颖的不确定性感知注释和评估框架及度量方法,专为恶劣条件下的语义分割设计,以原则性的方式将超出人类识别能力的图像区域纳入评估范围;Dark Zurich 数据集,包含 2416 张未标记的夜间图像和 2920 张未标记的黄昏图像,以及与这些图像对应的白天版本。此外,还有一组 151 张带有精细像素级注释的夜间图像,这些注释是根据我们的协议创建的,作为首个基准数据集用于执行我们的新评估方法。实验结果表明,我们的引导式课程适应方法在真实夜间数据集上显著优于现有最先进方法,无论是在标准度量指标还是在我们提出的不确定性感知度量指标上均表现优异。进一步地,我们的不确定性感知评估揭示了选择性无效预测可以在包含模糊内容的数据(如我们的夜间基准数据集)上获得更好的结果,并且有利于涉及无效输入的安全导向应用。