17일 전
ORBIT: 가르칠 수 있는 객체 인식을 위한 실제 세계 소수 샘플 데이터셋
Daniela Massiceti, Luisa Zintgraf, John Bronskill, Lida Theodorou, Matthew Tobias Harris, Edward Cutrell, Cecily Morrison, Katja Hofmann, Simone Stumpf

초록
지난 10년간 객체 인식 기술은 큰 발전을 이뤘지만, 여전히 각 객체 카테고리당 많은 양의 고품질 학습 예제에 의존하고 있다. 반면, 단 몇 개의 예제로부터 새로운 객체를 학습할 수 있다면 로봇공학부터 사용자 맞춤화에 이르기까지 다양한 영향력 있는 응용이 가능해질 수 있다. 그러나 대부분의 소수 학습(few-shot learning) 연구는 실제 세계에서 적용될 때 직면하게 될 높은 변동성을 반영하지 못한 벤치마크 데이터셋에 의해 주도되어 왔다. 이 격차를 메우기 위해, 시각 장애인/저시력자를 위한 교육 가능한 객체 인식기의 실제 응용을 기반으로 한 ORBIT 데이터셋과 벤치마크를 제안한다. 이 데이터셋은 시각 장애인/저시력자가 스마트폰으로 촬영한 총 486개의 객체에 대한 3,822개의 영상으로 구성되어 있다. 벤치마크는 현실적이고 매우 도전적인 인식 문제를 반영하며, 소수 예제 및 높은 변동성 조건에서의 강건성(robustness)을 연구할 수 있는 풍부한 실험 환경을 제공한다. 우리는 벤치마크의 최초 최고 성능(첫 번째 state-of-the-art)을 설정하였으며, 향후 혁신의 여지가 막대함을 보여주고, 시각 장애인/저시력자 공동체를 위한 도구를 포함한 다양한 실제 비전 응용 분야에 영향을 미칠 잠재력을 지닌다. 데이터셋은 https://doi.org/10.25383/city.14294597 에서, 벤치마크 코드는 https://github.com/microsoft/ORBIT-Dataset 에서 공개한다.