2달 전

GOOD: 개방된 세계에서 객체 검출을 위한 기하학적 힌트 탐구

Huang, Haiwen ; Geiger, Andreas ; Zhang, Dan
GOOD: 개방된 세계에서 객체 검출을 위한 기하학적 힌트 탐구
초록

우리는 오픈 월드 클래스-애그노스틱 객체 검출이라는 과제를 다룹니다. 이는 제한된 수의 기본 객체 클래스에서 학습하여 이미지 내 모든 객체를 검출하는 것을 의미합니다. 최신 RGB 기반 모델들은 훈련 클래스에 과적합되어 새로운 형태의 객체를 검출하는데 자주 실패합니다. 이는 RGB 기반 모델들이 주로 외관 유사성을 바탕으로 새로운 객체를 검출하며, 질감과 구별적인 부분 등의 단축 힌트에 과적합되기 쉽기 때문입니다. 이러한 RGB 기반 객체 검출기의 한계점을 해결하기 위해, 우리는 일반 목적 단안 추정기에서 예측된 깊이와 법선 같은 기하학적 힌트를 통합하는 방법을 제안합니다. 구체적으로, 우리는 기하학적 힌트를 사용하여 훈련 세트에서 주석이 없는 새로운 객체들을 가짜 라벨링하기 위한 객체 제안 네트워크를 훈련시킵니다. 이렇게 하여 개발된 기하학적 정보 안내 오픈 월드 객체 검출기(GOOD)는 새로운 객체 카테고리의 검출 재현율을 크게 향상시키며, 몇 개의 훈련 클래스만으로도 우수한 성능을 보입니다. COCO 데이터셋에서 "사람" 클래스 하나만으로 훈련했을 때, GOOD은 최신 방법론(SOTA)보다 5.0% AR@100 성능을 높였으며, 이는 상대적으로 24%의 개선률을 나타냅니다.