18일 전

계층적 샷 탐지기

{ Xuelong Li, Jungong Han, Yanwei Pang, Jiale Cao}
계층적 샷 탐지기
초록

싱글샷 디텍터는 기본 박스의 객체 카테고리와 회귀 오프셋을 동시에 예측한다. 높은 효율성에도 불구하고, 이 구조에는 몇 가지 부적절한 설계가 존재한다: (1) 추론 과정에서 기본 박스의 분류 결과가 회귀된 박스에 잘못 할당되는 문제, (2) 단일 회귀로는 정확한 객체 탐지에 충분하지 않다는 점. 첫 번째 문제를 해결하기 위해 새로운 reg-offset-cls (ROC) 모듈이 제안된다. 이 모듈은 세 가지 계층적 단계로 구성된다: 박스 회귀, 특징 샘플링 위치 예측, 그리고 오프셋 위치의 특징을 이용한 회귀된 박스 분류. 두 번째 문제를 더욱 해결하기 위해 계층적 샷 디텍터(HSD)가 제안되며, 이는 두 개의 ROC 모듈과 하나의 특징 강화 모듈을 겹쳐 구성된다. 두 번째 ROC는 첫 번째 ROC의 회귀된 박스와 특징 샘플링 위치를 입력으로 사용한다. 한편, 두 ROC 사이에 삽입된 특징 강화 모듈은 국소적 및 비국소적 맥락을 추출하는 데 목적이 있다. MS COCO 및 PASCAL VOC 데이터셋에서의 실험 결과는 제안된 HSD의 우수성을 입증한다. 복잡한 기법 없이도 HSD는 실시간 속도에서 모든 단계식 방법들보다 뛰어난 성능을 보였다.

계층적 샷 탐지기 | 최신 연구 논문 | HyperAI초신경