11일 전

너는 네가 뿌린 것을 거두게 된다: 약한 감독 객체 탐지를 위한 고정밀 객체 제안 생성을 위한 영상 사용

{ Yong Jae Lee, Krishna Kumar Singh}
너는 네가 뿌린 것을 거두게 된다: 약한 감독 객체 탐지를 위한 고정밀 객체 제안 생성을 위한 영상 사용
초록

우리는 약한 감독 객체 탐지(weakly-supervised object detection)를 위한 고정밀 객체 후보 영역(object proposals)을 얻기 위해 영상을 새로운 방식으로 활용하는 방법을 제안한다. 기존의 약한 감독 탐지 기법들은 엣지 박스(edge boxes)나 선택적 탐색(selective search)과 같은 사전에 제공되는 후보 영역 생성 방법을 사용하여 후보 박스를 도출한다. 이러한 방법들은 높은 재현율(recall)을 제공하지만, 수천 개의 노이즈가 포함된 후보 영역을 동반한다. 따라서 실제 관련 객체 영역을 찾는 작업의 전부가 다음 단계인 객체 마이닝(object mining)에 맡겨지게 된다. 이 문제를 완화하기 위해, 본 연구는 초기 후보 객체 영역의 정밀도(precision)를 향상시키는 데 초점을 맞춘다. 정위치(annotation) 정보에 의존할 수 없기 때문에, 우리는 영상(video)을 활용하여 움직임 신호(motion cues)를 이용해 객체의 범위를 자동으로 추정함으로써, 약한 감독 영역 후보 네트워크(Weakly-supervised Region Proposal Network, W-RPN)를 학습시킨다. 학습된 W-RPN은 고정밀 객체 후보 영역을 생성하며, 이러한 후보 영역은 엣지 박스나 선택적 탐색과 같은 고재현율 후보 영역들을 공간적 겹침(spatial overlap) 기준으로 재정렬하는 데 사용된다. 제안한 W-RPN 후보 영역은 PASCAL VOC 2007 및 2012 데이터셋에서 최신 약한 감독 객체 탐지 기법들에 대해 의미 있는 성능 향상을 가져왔다.

너는 네가 뿌린 것을 거두게 된다: 약한 감독 객체 탐지를 위한 고정밀 객체 제안 생성을 위한 영상 사용 | 최신 연구 논문 | HyperAI초신경