12일 전

내부-외부 안내를 통한 상호작용 객체 세그멘테이션

{ Yao Zhao, Shikui Wei, Yunchao Wei, Jun Hao Liew, Shiyin Zhang}
내부-외부 안내를 통한 상호작용 객체 세그멘테이션
초록

본 논문은 인간의 상호작용 비용을 최소화하면서 정밀한 객체 세그멘테이션 마스크를 얻는 방법을 탐구한다. 이를 위해 본 연구에서는 내부-외부 안내(Inside-Outside Guidance, IOG) 기법을 제안한다. 구체적으로, 대상 객체를 둘러싸는 타이트한 경계 박스의 중심 근처에 위치한 내부 점 하나와, 경계 박스의 대칭 꼭짓점 위치(상좌-하우 또는 상우-하좌)에 있는 두 개의 외부 점을 활용한다. 이로 인해 총 1개의 전경 클릭과 4개의 배경 클릭이 발생하게 된다. 본 IOG 기법의 장점은 네 가지이다. 첫째, 두 개의 외부 점은 다른 객체나 배경으로부터의 방해 요소를 제거하는 데 도움을 준다. 둘째, 내부 점은 경계 박스 내부에 존재하지만 관련 없는 영역을 제거하는 데 기여한다. 셋째, 내부 및 외부 점은 직관적으로 식별 가능하여, 최신 기술인 DEXTR이 일부 극단적인 샘플에 대해 발생시키는 라벨링 혼란을 줄일 수 있다. 넷째, 본 방법은 추가 클릭을 자연스럽게 지원하여 후속 보정이 가능하다. 간단한 구조임에도 불구하고, IOG는 여러 인기 있는 벤치마크에서 최첨단 성능을 달성하며, 정교한 미세조정 없이도 도로 풍경, 항공 영상, 의료 영상 등 다양한 도메인에 걸쳐 강력한 일반화 능력을 보여준다. 또한, 기존의 오프더쉘 경계 박스(예: ImageNet 및 Open Images 데이터셋)를 활용하여 고품질의 인스턴스 세그멘테이션 마스크를 생성할 수 있는 간단한 이단계(2-stage) 솔루션도 제안한다. 이는 IOG가 어노테이션 도구로서 뛰어난 우수성을 지닌다는 것을 입증한다.

내부-외부 안내를 통한 상호작용 객체 세그멘테이션 | 최신 연구 논문 | HyperAI초신경