2달 전

Mask R-CNN

He, Kaiming ; Gkioxari, Georgia ; Dollár, Piotr ; Girshick, Ross
Mask R-CNN
초록

우리는 객체 인스턴스 분할을 위한 개념적으로 간단하고 유연하며 일반적인 프레임워크를 제시합니다. 본 접근 방식은 이미지 내의 객체를 효율적으로 감지하면서 동시에 각 인스턴스에 대한 고품질 세그멘테이션 마스크를 생성합니다. 이 방법은 Mask R-CNN으로 불리며, 기존의 바운딩 박스 인식 브랜치와 병렬로 객체 마스크를 예측하는 브랜치를 추가하여 Faster R-CNN을 확장합니다. Mask R-CNN은 훈련하기 쉽고 Faster R-CCN에 비해 매우 적은 부가 비용만을 추가하며, 5 fps의 속도로 실행됩니다. 또한, Mask R-CNN은 다른 작업들에도 쉽게 일반화될 수 있으며, 예를 들어 동일한 프레임워크에서 인간 자세를 추정할 수 있습니다. 우리는 COCO 챌린지 시리즈의 세 가지 트랙 모두에서 최상위 결과를 보여주며, 이는 인스턴스 분할, 바운딩 박스 객체 검출, 그리고 사람 키포인트 검출을 포함합니다. 특별한 튜닝 없이도 Mask R-CNN은 모든 작업에서 기존 단일 모델 엔트리들을 능가하며, COCO 2016 챌린지 우승자들도 포함됩니다. 우리는 간단하면서도 효과적인 본 접근 방식이 견고한 베이스라인으로 작용하고 인스턴스 레벨 인식 연구의 미래 발전을 돕기를 바랍니다. 코드는 다음 주소에서 제공됩니다: https://github.com/facebookresearch/Detectron

Mask R-CNN | 최신 연구 논문 | HyperAI초신경