12일 전

WSOD2: 약한 감독 객체 탐지를 위한 하향식 및 상향식 객체성 정제 학습

{Lei Zhang, Zhaoyang Zeng, Jianlong Fu, Hongyang Chao, Bei Liu}
WSOD2: 약한 감독 객체 탐지를 위한 하향식 및 상향식 객체성 정제 학습
초록

우리는 객체 수준의 레이블링에 대한 인간의 개입을 줄이는 데 핵심적인 역할을 하는 약한 감독 객체 탐지(Weakly-Supervised Object Detection, WSOD)에 대해 연구한다. 기존의 주요 연구들은 영역 제안(region proposal) 기법과 컨볼루션 신경망(Convolutional Neural Networks, CNN)을 통합하는 방식을 사용한다. 비록 CNN은 구분력 있는 국부적 특징을 효과적으로 추출할 수 있지만, 경계 상자(Bounding Box)가 전체 객체를 포함하고 있는 가능성(즉, "객체성(Objectness)")을 측정하는 데 여전히 큰 도전 과제가 존재한다. 본 논문에서는 약한 감독 객체 탐지에 특화된 새로운 학습 메커니즘을 설계하여, 객체성 증류(Objectness Distillation)를 도입한 새로운 WSOD 프레임워크인 WSOD2를 제안한다. 다양한 회귀 목표값은 저수준 측정값과 CNN의 신뢰도를 종합적으로 고려하여 하향식(Bottom-Up, BU)과 상향식(Top-Down, TD) 객체성을 적응형 선형 조합 방식으로 특별히 결정한다. 경계 상자 회귀는 학습 과정에서 객체성이 높은 영역 제안이 회귀 목표에 점차 가까워지도록 촉진하며, 이 과정을 통해 하향식 증거로부터 학습된 깊은 객체성 표현이 최적화를 통해 CNN에 점차 증류된다. 본 연구에서는 BU/ TD 객체성에 대해 다양한 적응형 학습 곡선을 탐색하고, 제안된 WSOD2가 최신 기술 수준(SOTA)의 성능을 달성할 수 있음을 보여준다.