11일 전

MST: 적응형 다중 스케일 토큰을 통한 상호작용 세그멘테이션

Long Xu, Shanghong Li, Yongquan Chen, Jun Luo, Shiwu Lai
MST: 적응형 다중 스케일 토큰을 통한 상호작용 세그멘테이션
초록

인터랙티브 세그멘테이션은 인간-컴퓨터 상호작용 및 데이터 어노테이션 분야에서 중요한 관심을 받고 있다. 인터랙티브 세그멘테이션에서 대상 객체의 스케일 변동 문제를 해결하기 위해, 본 연구에서는 새로운 다중 스케일 토큰 적응 알고리즘을 제안한다. 다중 스케일 토큰에 걸쳐 top-k 연산을 수행함으로써 계산 복잡도를 크게 단순화하면서도 성능을 보장할 수 있다. 또한 다중 스케일 토큰 선택의 강건성을 향상시키기 위해 대조 손실(contrastive loss) 기반의 토큰 학습 알고리즘도 제안한다. 이 알고리즘은 다중 스케일 토큰 적응의 성능을 효과적으로 향상시킨다. 광범위한 벤치마킹 결과에 따르면, 제안된 알고리즘은 기존 방법들과 비교하여 최상위 수준(SOTA)의 성능을 달성하였다. 인터랙티브 데모 및 모든 재현 가능한 코드는 https://github.com/hahamyt/mst 에서 공개될 예정이다.

MST: 적응형 다중 스케일 토큰을 통한 상호작용 세그멘테이션 | 최신 연구 논문 | HyperAI초신경