2달 전

마스크 인식 IoU를 이용한 실시간 인스턴스 분할에서 앵커 할당

Kemal Oksuz; Baris Can Cam; Fehmi Kahraman; Zeynep Sonat Baltaci; Sinan Kalkan; Emre Akbas
마스크 인식 IoU를 이용한 실시간 인스턴스 분할에서 앵커 할당
초록

본 논문에서는 인스턴스 분할 방법의 훈련 과정에서 앵커 박스를 양성 및 음성으로 할당하기 위한 마스크 인식 교차 영역 비율(Mask-aware Intersection-over-Union, maIoU)을 제시합니다. 기존의 IoU나 그 변형과 달리, maIoU는 두 박스 간의 근접성을 고려하는 것뿐만 아니라, 앵커 박스와 지면 진실 마스크 간의 근접성을 일관되게 측정합니다. 따라서, 실제로 객체의 형태를 나타내는 마스크를 추가로 고려함으로써, maIoU는 훈련 중 더 정확한 감독을 가능하게 합니다. 우리는 YOLACT라는 최신(real-time) 실시간 인스턴스 분할 방법을 훈련시키면서 IoU 연산을 maIoU로 대체하여 ATSS(Adaptive Training Sample Selection)라는 최신(SOTA) 할당기에서 maIoU의 효과를 보여줍니다. 결과적으로, (i) IoU를 사용한 ATSS보다 약 1%의 마스크 AP(mask Average Precision) 개선, (ii) 다양한 이미지 크기에서 고정된 IoU 임계값 할당기를 사용한 베이스라인 YOLACT보다 약 2%의 마스크 AP 개선, 그리고 (iii) 더 적은 수의 앵커를 사용하여 추론 시간을 25% 줄이는 등의 성능 향상을 확인할 수 있었습니다. 이러한 효율성을 활용하여, 우리는 YOLACT보다 빠르고 +6 AP(Average Precision)가 더 정확한 검출기인 maYOLACT를 설계하였습니다. 우리의 최고 모델은 COCO test-dev 데이터셋에서 25 fps(fps: frames per second)로 37.7%의 마스크 AP를 달성하며, 실시간 인스턴스 분할에 있어서 새로운 최신 기준(state-of-the-art)을 세웠습니다. 코드는 https://github.com/kemaloksuz/Mask-aware-IoU 에서 제공됩니다.

마스크 인식 IoU를 이용한 실시간 인스턴스 분할에서 앵커 할당 | 최신 연구 논문 | HyperAI초신경