17일 전
BoxMask: 비디오 객체 탐지를 위한 경계 상자 감독 재검토
Khurram Azeem Hashmi, Alain Pagani, Didier Stricker, Muhammamd Zeshan Afzal

초록
우리는 영상 객체 탐지의 성능을 향상시키기 위한 새로운 간단하면서도 효과적인 접근법을 제안한다. 기존 연구들은 개체 수준의 특징 집약에 초점을 맞추며, 보다 정교한 픽셀 수준의 표현을 무시하는 경향이 있으며, 이로 인해 외형이나 운동 특성이 유사한 객체들 간에 혼동이 발생한다. 이러한 한계를 해결하기 위해 우리는 클래스 인식 가능한 픽셀 수준 정보를 통합함으로써 구분 가능한 표현을 효과적으로 학습하는 BoxMask를 제안한다. 본 방법에서는 각 객체에 대해 바운딩 박스 레이블을 간단히 원시 마스크로 간주하여 학습을 지도한다. 제안된 모듈은 어떤 영역 기반 탐지기에도 쉽게 통합될 수 있으며, 탐지 성능을 향상시킬 수 있다. ImageNet VID 및 EPIC KITCHENS 데이터셋에서 실시한 광범위한 실험을 통해, 최근의 다양한 최신 상태의 기법들에 본 BoxMask 모듈을 적용했을 때 일관되고 유의미한 성능 향상이 나타남을 확인하였다.