12일 전

FocusCut: 인터랙티브 세그멘테이션에서 포커스 뷰로 깊이 들어가기

{Ming-Ming Cheng, Chun-Le Guo, Zhao Zhang, Zheng-Peng Duan, Zheng Lin}
FocusCut: 인터랙티브 세그멘테이션에서 포커스 뷰로 깊이 들어가기
초록

인터랙티브 이미지 세그멘테이션은 픽셀 단위의 어노테이션 및 이미지 편집에서 핵심적인 도구이다. 고정밀 이진 세그멘테이션 마스크를 얻기 위해 사용자는 객체의 세부 정보, 예를 들어 윤곽선이나 구멍 같은 부분 주변에 상호작용 클릭을 추가함으로써 효율적으로 세부 사항을 보정하고자 한다. 기존의 방법들은 이러한 보정 클릭을 전역 예측을 공동 결정하는 가이던스로 간주한다. 그러나 전역적인 시각은 모델이 후속 클릭에 집중하는 능력을 상실하게 하며, 사용자의 의도와도 부합하지 않는다. 본 논문에서는 클릭의 시각을 재고하여, 클릭이 객체의 세부 사항을 결정하는 주도적인 역할을 다시 부여하고자 한다. 집중 시각의 필요성을 검증하기 위해, 객체 세그멘테이션과 국부적 보정 기능을 통합한 간단하면서도 효과적인 파이프라인인 FocusCut을 설계하였다. 전역 예측을 얻은 후, 적응적인 범위로 원본 이미지에서 클릭 중심의 패치를 자르고, 이를 통해 국부적 예측을 점진적으로 보정한다. 사용자 인지나 모델 파라미터의 증가 없이도, 본 방법은 최첨단 성능을 달성하였다. 광범위한 실험 및 시각화 결과를 통해 FocusCut이 인터랙티브 이미지 세그멘테이션에서 초미세 세그멘테이션을 가능하게 함을 입증하였다.

FocusCut: 인터랙티브 세그멘테이션에서 포커스 뷰로 깊이 들어가기 | 최신 연구 논문 | HyperAI초신경