11일 전
Objectron: 포즈 애너테이션을 갖춘 자연 환경에서의 객체 중심 비디오 대규모 데이터셋
Adel Ahmadyan, Liangkai Zhang, Jianing Wei, Artsiom Ablavatski, Matthias Grundmann

초록
3D 객체 탐지 기술은 로봇공학, 증강현실, 자율주행, 이미지 검색 등 다양한 분야에서의 응용이 늘어나며 최근 주목받고 있다. 3D 객체 탐지 기술의 발전을 이끌고 새로운 연구 및 응용(예: 3D 객체 추적, 시점 합성, 개선된 3D 형태 표현 등)을 촉진하기 위해 우리는 Objectron 데이터셋을 소개한다. 이 데이터셋은 9개의 객체 카테고리에 대해 포즈 레이블이 부여된 객체 중심의 단편 영상으로 구성되어 있으며, 총 14,819개의 레이블링된 영상에서 400만 장의 레이블링된 이미지를 포함한다. 또한 3D 객체 탐지에 적합한 새로운 평가 지표인 3D 교차율(3D Intersection over Union)을 제안한다. 본 데이터셋이 3D 객체 탐지 작업에서 얼마나 유용한지 보여주기 위해, 해당 데이터셋으로 훈련된 기준 모델(Baseline models)을 제공한다. 본 데이터셋 및 평가용 소스 코드는 http://www.objectron.dev 에서 온라인으로 공개되어 있다.