라벨 분리 프레임워크를 이용한 주요 객체 검출

정확한 주요성 맵을 얻기 위해 최근의 방법들은 주로 완전 합성곱 네트워크(Fully Convolutional Network, FCN)에서 다중 수준의 특징을 집계하고, 경계 정보를 보조 감독으로 도입하는 데 초점을 맞추고 있습니다. 이러한 접근법으로 상당한 진전이 이루어졌지만, 우리는 픽셀이 경계에 가까울수록 예측하기가 더 어려워진다는 점을 관찰하였습니다. 이는 경계 픽셀들의 분포가 매우 불균형하기 때문입니다. 이 문제를 해결하기 위해, 우리는 라벨 분리 프레임워크(Label Decoupling Framework, LDF)를 제안합니다. LDF는 라벨 분리(LD) 과정과 특징 상호작용 네트워크(Feature Interaction Network, FIN)로 구성됩니다.LD는 원래의 주요성 맵을 객체 중심 영역에 집중하는 본체 맵(body map)과 경계 주변 영역에 집중하는 세부 맵(detail map)으로 명시적으로 분해합니다. 세부 맵은 전통적인 경계 감독보다 훨씬 많은 픽셀을 포함하므로 더 효과적으로 작동합니다. 주요성 맵과 달리, 본체 맵은 경계 픽셀들을 배제하고 오직 중심 영역에만 주목합니다. 이를 통해 훈련 중 경계 픽셀로부터의 방해를 성공적으로 피할 수 있습니다. 따라서, FIN에서는 본체 맵과 세부 맵을 각각 처리하기 위한 두 개의 브랜치를 사용합니다.특징 상호작용(FI)은 두 개의 보완적인 브랜치를 융합하여 주요성 맵을 예측하도록 설계되었습니다. 이 예측된 주요성 맵은 다시 두 개의 브랜치를 정교하게 조정하는 데 사용됩니다. 이러한 반복적인 정교화 과정은 더 나은 표현 학습과 더욱 정확한 주요성 맵 생성에 도움이 됩니다. 여섯 개의 벤치마크 데이터셋에서 수행된 포괄적인 실험 결과, LDF는 다양한 평가 지표에서 최신 기술들과 비교해 우수한 성능을 보였습니다.