
초록
그림 이해를 위한 중요한 과제 중 하나인 그림자 탐지(Shadow detection)는 여전히 도전적인 문제로 남아 있다. 최근의 딥러닝 기반 기법들은 희망적인 성과를 보여주고 있으나, 그림자 영역과 비그림자 영역의 시각적 특성이 유사한 모호한 경우(본 연구에서는 이를 '혼란 요소'(distraction)라고 지칭)에 대해서는 여전히 어려움을 겪고 있다. 본 논문에서는 종단 간(end-to-end) 프레임워크 내에서 시각적 혼란 요소 영역의 의미 정보를 명시적으로 학습하고 통합함으로써, 혼란 요소를 인지하는 그림자 탐지 네트워크(Distraction-aware Shadow Detection Network, DSDNet)를 제안한다. 본 연구의 핵심은 독립적이고 미분 가능한 새로운 혼란 요소 인식 그림자(Distraction-aware Shadow, DS) 모듈로, 이는 오진(false positive)와 탈락(false negative)를 명시적으로 예측함으로써, 강건한 그림자 탐지를 위한 혼란 요소 인지 특징을 학습할 수 있도록 한다. 제안한 방법의 성능을 평가하기 위해 SBU, UCF, ISTD 세 가지 공개 그림자 탐지 데이터셋에서 광범위한 실험을 수행하였다. 실험 결과, 본 모델은 오진과 탈락 탐지를 효과적으로 억제함으로써 그림자 탐지 성능을 향상시키며, 기존의 최고 수준의 성능을 달성함을 입증하였다.