2달 전

CenterMask: 실시간 앵커 없는 인스턴스 분할

Youngwan Lee; Jongyoul Park
CenterMask: 실시간 앵커 없는 인스턴스 분할
초록

우리는 간단하면서도 효율적인 앵커 없는 인스턴스 분할(Anchor-free Instance Segmentation) 방법을 제안하며, 이를 CenterMask라고 명명하였습니다. CenterMask는 Mask R-CNN과 유사한 방식으로 앵커 없는 단일 스테이지 객체 검출기(FCOS)에 새로운 공간 주의 안내 마스크(Spatial Attention-Guided Mask, SAG-Mask) 브랜치를 추가합니다. FCOS 객체 검출기에 통합된 SAG-Mask 브랜치는 공간 주의 맵을 사용하여 각 박스에서 분할 마스크를 예측하며, 이는 정보가 있는 픽셀에 집중하고 노이즈를 억제하는 역할을 합니다.또한, 우리는 두 가지 효과적인 전략을 적용하여 개선된 백본 네트워크인 VoVNetV2를 제시합니다: (1) 큰 VoVNet \cite{lee2019energy}의 최적화 문제를 완화하기 위한 잔차 연결(Residual Connection), (2) 원래 SE에서 발생하는 채널 정보 손실 문제를 해결하기 위한 효과적인 스케줄-익사이테이션(effective Squeeze-Excitation, eSE).SAG-Mask와 VoVNetV2를 통해 우리는 대형 모델용 CenterMask와 소형 모델용 CenterMask-Lite를 설계하였습니다. 동일한 ResNet-101-FPN 백본을 사용하여, CenterMask는 38.3%의 성능을 달성하였으며, 이는 이전 최신 기술들보다 훨씬 빠른 속도로 모든 것을 초월하였습니다. 또한, CenterMask-Lite는 Titan Xp에서 35fps 이상에서 이전 최신 기술들을 크게 능가하는 성능을 보여주었습니다. 우리는 CenterMask와 VoVNetV2가 각각 실시간 인스턴스 분할 및 다양한 비전 작업의 백본 네트워크로서 견고한 베이스라인 역할을 할 수 있기를 바랍니다. 코드는 https://github.com/youngwanLEE/CenterMask에서 제공됩니다.

CenterMask: 실시간 앵커 없는 인스턴스 분할 | 최신 연구 논문 | HyperAI초신경