2달 전

대규모 이미지 컬렉션에서 비지도학습 다중 객체 발견을 향하여

Vo, Huy V. ; Pérez, Patrick ; Ponce, Jean
대규모 이미지 컬렉션에서 비지도학습 다중 객체 발견을 향하여
초록

본 논문은 감독 없이 이미지 집합에서 존재하는 객체를 발견하는 문제를 다룹니다. 우리는 Vo 등(CVPR'19)의 최적화 접근 방식을 기반으로 하되, 몇 가지 핵심적인 혁신을 제안합니다: (1) 다른 경쟁 방법들보다 지상 진실 객체와 상당히 높은 중복도를 달성하는 새로운 주목도 기반 영역 제안 알고리즘을 제안합니다. 이 절차는 분류 작업에 대해 훈련된 사전 제공된 CNN 특징들을 사용하지만, 바운딩 박스 정보 없이 이루어집니다(주목도 기반 영역 제안). (2) Vo 등이 제시한 객체 발견 접근 방식에서 제안들의 고유한 계층 구조를 효과적인 정규화기로 활용하여 성능을 크게 향상시키며, 여러 표준 벤치마크에서 현존하는 최고 수준을 크게 개선하였습니다. (3) 전체 이미지 집합을 사용하여 각 이미지가 묘사하는 객체를 발견하기 전에 작은 무작위 이미지 세트를 사용하여 유망한 제안들을 선택하는 두 단계 전략을 채택하였습니다. 이로 인해 최대 20,000개의 이미지를 포함하는 데이터셋에서 각각의 사진마다 여러 객체를 발견할 수 있게 되었으며, 이는 기존 방법들에 비해 5배 이상 증가한 것으로, 처음으로(우리가 아는 한) 대규모 비감독 이미지 해석에 대한 첫걸음을 내딛는 것입니다.

대규모 이미지 컬렉션에서 비지도학습 다중 객체 발견을 향하여 | 최신 연구 논문 | HyperAI초신경