11일 전

AGSS-VOS: 주의 유도 단일 촬영 비디오 객체 세그멘테이션

{ Jiaya Jia, Xiaojuan Qi, Huaijia Lin}
AGSS-VOS: 주의 유도 단일 촬영 비디오 객체 세그멘테이션
초록

대부분의 비디오 객체 세그멘테이션 접근 방식은 각 객체를 별도로 처리한다. 이로 인해 여러 객체가 존재할 경우 계산 비용이 크게 증가한다. 본 논문에서는 인스턴스 무관( instance-agnostic) 및 인스턴스 특정( instance-specific) 모듈을 활용하여 하나의 전방향 경로에서 다중 객체를 동시에 세그멘테이션하는 AGSS-VOS를 제안한다. 두 모듈에서 생성된 정보는 주의 기반(attention-guided) 디코더를 통해 융합되어 한 번의 경로 내에서 모든 객체 인스턴스를 동시에 세그멘테이션할 수 있다. 전체 프레임워크는 인스턴스 IoU 손실을 사용하여 엔드 투 엔드로 학습 가능하다. Youtube-VOS 및 DAVIS-2017 데이터셋에서의 실험 결과를 통해 AGSS-VOS가 정확성과 효율성 측면에서 경쟁력 있는 성능을 달성함을 입증하였다.

AGSS-VOS: 주의 유도 단일 촬영 비디오 객체 세그멘테이션 | 최신 연구 논문 | HyperAI초신경