11일 전

PSNet 및 박스 회귀를 이용한 WSOD

Sheng Yi, Xi Li, Huimin Ma
PSNet 및 박스 회귀를 이용한 WSOD
초록

약한 감독 객체 탐지(Weakly Supervised Object Detection, WSOD)는 객체 탐지 작업을 학습할 때 이미지 수준의 레이블만을 사용한다. WSOD는 시간이 오래 걸리는 인스턴스 수준의 레이블을 요구하지 않기 때문에, 이 작업에 대한 연구가 점점 더 많은 주목을 받고 있다. 기존의 약한 감독 객체 탐지 방법들은 탐지기와 가상 레이블(pseudo-label)을 반복적으로 업데이트하거나, 특징 기반 마스크 아웃(masks-out) 기법을 사용한다. 그러나 이러한 대부분의 방법들은 완전하고 정확한 후보 박스(proposal)를 생성하지 못하며, 종종 객체의 가장 구분력 있는 부분만을 포함하거나, 너무 많은 배경 영역을 포함하는 경향이 있다. 이 문제를 해결하기 위해, 우리는 약한 감독 객체 탐지 네트워크에 박스 회귀(Box Regression) 모듈을 추가하고, 이를 감독하기 위한 제안 점수 네트워크(Proposal Scoring Network, PSNet)를 제안한다. 박스 회귀 모듈은 후보 박스를 조정하여 후보 박스와 진짜 레이블(Ground Truth) 간의 IoU를 향상시킨다. PSNet은 박스 회귀 네트워크에서 출력된 후보 박스를 점수화하고, 이 점수를 활용하여 박스 회귀 모듈을 개선한다. 또한, 박스 회귀 모듈을 학습시키기 위해 보다 정확한 가상 레이블을 생성하기 위해 PRS 알고리즘을 활용한다. 이러한 방법들을 통해 PASCAL VOC 2007 및 2012 데이터셋에서 탐지기를 학습하였으며, 상당히 향상된 성능을 달성하였다.

PSNet 및 박스 회귀를 이용한 WSOD | 최신 연구 논문 | HyperAI초신경