12일 전

적은 것이 더 많다: 부분 집계를 활용한 약한 감독 객체 탐지 기반 이미지 세그멘테이션

{Qi Qi, Jianxin Liao, Haifeng Sun, Jingyu Wang, Ce Ge}
적은 것이 더 많다: 부분 집계를 활용한 약한 감독 객체 탐지 기반 이미지 세그멘테이션
초록

약한 감독 객체 탐지기에서 발생하는 주요 실패 사례를 해결하고자 한다. 대부분의 약한 감독 객체 탐지 방법은 사전에 생성된 후보 박스(proposals)에 기반하고 있어, 두 가지 주요 오류를 보인다: (i) 하나의 경계 박스로 여러 개의 객체 인스턴스를 묶는 현상, (ii) 전체 객체가 아닌 부분만에 집중하는 현상. 이를 해결하기 위해 개별 객체 인스턴스를 정확히 탐지할 수 있도록 도와주는 이미지 세그멘테이션 프레임워크를 제안한다. 입력 이미지는 후보 박스 간의 겹침을 기준으로 여러 하위 이미지로 분할하여 객체의 묶음 현상을 해소한다. 이후 이 하위 이미지들의 배치를 컨볼루션 네트워크에 입력하여 객체 탐지기를 학습시킨다. 각 하위 이미지 내에서는 제안 수준의 점수 중 일부를 동적으로 선택하는 부분 집계 전략(partial aggregation strategy)을 도입하여 하위 이미지 수준의 출력을 생성한다. 이는 모델이 객체 내용에 대한 맥락 지식을 학습하도록 정규화한다. 마지막으로, 각 하위 이미지의 출력을 통합하여 모델의 최종 예측을 도출한다. 제안된 방법은 최신의 최고 성능 약한 감독 탐지 방법들과 비교 가능하도록 VGG-D 백본을 사용하여 구현하였다. PASCAL VOC 데이터셋에서 실시한 광범위한 실험 결과를 통해 본 설계의 우수성을 입증하였으며, 탐지, 위치 지정, 분류 모든 과제에서 기존 대안들보다 뛰어난 성능을 보였다.

적은 것이 더 많다: 부분 집계를 활용한 약한 감독 객체 탐지 기반 이미지 세그멘테이션 | 최신 연구 논문 | HyperAI초신경