19일 전

VarifocalNet: IoU 인식 기반 밀도 객체 탐지기

Haoyang Zhang, Ying Wang, Feras Dayoub, Niko Sünderhauf
VarifocalNet: IoU 인식 기반 밀도 객체 탐지기
초록

밀도 높은 객체 탐지기에서 후보 탐지 결과를 정확히 순위 매기는 것은 높은 성능을 달성하는 데 핵심적인 요소이다. 기존 연구들은 후보들을 순위 매기기 위해 분류 점수 또는 분류 점수와 예측된 위치 정보 점수의 조합을 사용해 왔다. 그러나 이러한 방법 중 어느 것도 신뢰할 수 있는 순위 매기기를 보장하지 못하며, 결과적으로 탐지 성능 저하를 초래한다. 본 논문에서는 객체 존재 신뢰도와 위치 정확도를 종합적으로 반영하는 Iou-aware Classification Score(IACS)를 학습하는 새로운 접근법을 제안한다. IACS 기반으로 밀도 높은 객체 탐지기가 후보 탐지 결과를 더 정확히 순위 매길 수 있음을 보여준다. 이를 위해 IACS를 예측할 수 있도록 설계된 새로운 손실 함수인 Varifocal Loss를 제안하고, IACS 예측 및 경계상자 보정을 위한 새로운 별형 경계상자 특징 표현 방식을 도입한다. 이러한 두 가지 새로운 구성 요소와 경계상자 보정 브랜치를 결합하여 FCOS+ATSS 아키텍처 기반의 IoU-aware 밀도 높은 객체 탐지기인 VarifocalNet(VFNet)을 구축하였다. MS COCO 데이터셋에서 실시한 광범위한 실험 결과, 다양한 백본을 사용할 때 VFNet은 강력한 기준 모델보다 약 2.0 AP 상승을 지속적으로 달성함을 확인하였다. 특히 Res2Net-101-DCN을 사용한 최고 성능 모델인 VFNet-X-1200은 COCO test-dev에서 단일 모델, 단일 스케일 기준으로 55.1의 AP를 기록하며, 다양한 객체 탐지기 중 최고 수준의 성능을 보였다. 코드는 https://github.com/hyz-xmaster/VarifocalNet 에서 공개되어 있다.

VarifocalNet: IoU 인식 기반 밀도 객체 탐지기 | 연구 논문 | HyperAI초신경