
摘要
阴影检测是场景理解中一项重要且具有挑战性的任务。尽管近年来基于深度学习的方法取得了令人瞩目的成果,但现有方法在处理视觉外观上难以区分的阴影与非阴影区域(本文中称为“干扰区域”)时仍存在困难。为此,本文提出一种面向干扰感知的阴影检测网络(Distraction-aware Shadow Detection Network, DSDNet),通过在端到端框架中显式学习并融合视觉干扰区域的语义信息,提升检测性能。该框架的核心是一个新颖的独立式、可微分的干扰感知阴影(Distraction-aware Shadow, DS)模块,该模块通过显式预测误报(false positives)和漏报(false negatives),使模型能够学习到对干扰具有鲁棒性的判别性特征。我们在三个公开的阴影检测数据集(SBU、UCF 和 ISTD)上进行了大量实验以评估所提方法。实验结果表明,该模型能够有效抑制误报与漏报,显著提升阴影检测性能,达到当前最优(state-of-the-art)水平。