7일 전
진행 학습을 통한 반복적 일반화 윤곽 기반 인스턴스 세그멘테이션
Hao Feng, Keyi Zhou, Wengang Zhou, Yufei Yin, Jiajun Deng, Qi Sun, Houqiang Li

초록
윤곽 기반 인스턴스 세그멘테이션은 복잡한 배경 내에서 시각적 객체를 처리하는 데 있어 유연성과 우아함을 제공하기 때문에 활발히 연구되어 왔다. 본 연구에서는 일반적인 윤곽 기반 인스턴스 세그멘테이션을 위한 새로운 딥 네트워크 아키텍처인 PolySnake을 제안한다. 고전적인 Snake 알고리즘에 영감을 받아 개발된 PolySnake은 반복적이고 점진적인 윤곽 정밀화 전략을 통해 뛰어난 성능과 강건성을 달성한다. 기술적으로 PolySnake은 반복적으로 객체 윤곽을 추정하기 위한 순환 업데이트 연산자를 도입한다. 이는 단일 윤곽 추정치를 유지하면서, 점차 객체 경계로 변형되는 방식으로 작동한다. 각 반복 단계에서 PolySnake은 현재 윤곽에 대한 의미적 풍부한 표현을 구축하고, 이를 순환 연산자에 입력하여 윤곽을 추가로 조정한다. 반복적인 정밀화 과정을 통해 윤곽은 점차 안정된 상태로 수렴하게 되며, 이 상태에서는 객체 인스턴스를 밀착하게 둘러싸게 된다. 일반적인 인스턴스 세그멘테이션을 넘어, 본 연구는 장면 텍스트 탐지 및 차선 탐지와 같은 두 가지 특정 작업 시나리오에서 PolySnake의 효과성과 일반화 능력을 검증하기 위해 광범위한 실험을 수행하였다. 실험 결과, 다양한 주요 벤치마크에서 세 가지 작업 모두에서 기존의 최첨단 방법들을 능가하는 성능을 보였다. 코드 및 사전 학습된 모델은 https://github.com/fh2019ustc/PolySnake 에서 공개되어 있다.