11일 전

인스턴스 인지형, 컨텍스트 집중형, 메모리 효율적인 약한 감독 객체 탐지

Zhongzheng Ren, Zhiding Yu, Xiaodong Yang, Ming-Yu Liu, Yong Jae Lee, Alexander G. Schwing, Jan Kautz
인스턴스 인지형, 컨텍스트 집중형, 메모리 효율적인 약한 감독 객체 탐지
초록

약한 감독 학습은 학습 중 강한 감독이 필요 없도록 함으로써 객체 탐지 분야에서 매력적인 도구로 부상하고 있다. 그러나 여전히 주요 과제들이 남아 있다: (1) 객체 인스턴스 간 구분이 모호할 수 있으며; (2) 탐지기가 전체 객체보다는 특징적인 부분에 집중하는 경향이 있으며; (3) 지표(ground truth)가 없을 경우 높은 재현율(Recall)을 확보하기 위해 객체 제안(Proposal)이 과도하게 중복되어 메모리 소비가 크게 발생한다. 이러한 과제들을 해결하는 것은 일반적으로 불확실성과 부차적인 해결책을 제거해야 하기 때문에 어려운 과제이다. 이러한 문제들을 해결하기 위해 우리는 인스턴스 인지형(Instance-aware)이고 맥락 중심(Context-focused)인 통합 프레임워크를 제안한다. 본 연구는 인스턴스 인지형 자기 훈련 알고리즘과 학습 가능한 Concrete DropBlock을 활용하며, 메모리 효율적인 순차적 배치 역전파(Sequential Batch Back-propagation) 기법을 도입한다. 제안하는 방법은 COCO 데이터셋에서 $12.1\%~AP$, $24.8\%~AP_{50}$, VOC 2007에서 $54.9\%~AP$, VOC 2012에서 $52.1\%~AP$의 최신 기준(SOTA) 성능을 달성하며, 기존 기준 모델 대비 큰 성능 향상을 보였다. 또한 본 연구는 ResNet 기반 모델과 약한 감독 영상 객체 탐지(Weakly Supervised Video Object Detection)에 대한 최초의 벤치마킹을 수행한 것으로, 의미 있는 기여를 한다. 코드, 모델 및 추가 정보는 다음 주소에서 공개될 예정이다: https://github.com/NVlabs/wetectron.

인스턴스 인지형, 컨텍스트 집중형, 메모리 효율적인 약한 감독 객체 탐지 | 최신 연구 논문 | HyperAI초신경