7일 전

ISDA: 변형 주의력 기반 위치 인식 인스턴스 세그멘테이션

Kaining Ying, Zhenhua Wang, Cong Bai, Pengfei Zhou
ISDA: 변형 주의력 기반 위치 인식 인스턴스 세그멘테이션
초록

대부분의 인스턴스 세그멘테이션 모델은 제안 영역 추정(RPN)을 사전 처리 단계로 포함하거나, 비최대 억제(NMS)를 후처리 단계로 사용함으로써 엔드투엔드 학습이 불가능하다. 본 연구에서는 이러한 문제를 해결하기 위해, 새로운 엔드투엔드 인스턴스 세그멘테이션 방법인 ISDA를 제안한다. ISDA는 객체 마스크의 집합을 예측하는 방식으로 작업을 재정의하며, 학습 가능한 위치 인식 커널과 객체 특징을 전통적인 합성곱 연산을 통해 생성한다. 이러한 커널과 특징은 다중 스케일 표현을 활용한 변형 가능한 어텐션 네트워크를 통해 학습된다. 제안된 세트 예측 메커니즘 덕분에, ISDA는 NMS가 필요하지 않다. 실험 결과, MS-COCO에서 강력한 기준 모델인 Mask R-CNN 대비 2.6점 높은 성능을 기록하며, 최근의 다른 모델들과 비교해도 최상의 성능을 보였다. 코드는 곧 공개될 예정이다.

ISDA: 변형 주의력 기반 위치 인식 인스턴스 세그멘테이션 | 최신 연구 논문 | HyperAI초신경