2달 전

고해상도 이진 이미지 분할을 위한 양방향 참조

Zheng, Peng ; Gao, Dehong ; Fan, Deng-Ping ; Liu, Li ; Laaksonen, Jorma ; Ouyang, Wanli ; Sebe, Nicu
고해상도 이진 이미지 분할을 위한 양방향 참조
초록

우리는 고해상도 이진 이미지 분할(Dichotomous Image Segmentation, DIS)을 위한 새로운 양방향 참조 프레임워크(Bilateral Reference Framework, BiRefNet)를 소개합니다. 이 프레임워크는 두 가지 핵심 구성 요소로 이루어져 있습니다: 위치 결정 모듈(Localization Module, LM)과 재구성 모듈(Reconstruction Module, RM)으로, 여기서 우리는 제안한 양방향 참조(Bilateral Reference, BiRef)를 사용합니다. LM은 전역적인 의미 정보를 활용하여 객체의 위치를 결정하는 데 도움을 줍니다. RM 내에서는 이미지의 계층적 패치가 원본 참조를 제공하고 그래디언트 맵이 대상 참조로 사용되는 재구성 과정에서 BiRef를 활용합니다. 이러한 구성 요소들이 협력하여 최종 예측 맵을 생성합니다. 또한, 세부적인 영역에 대한 초점을 강화하기 위해 보조 그래디언트 감독(Auxiliary Gradient Supervision)을 도입하였습니다. 더불어, DIS에 맞춤화된 실용적인 훈련 전략들을 제시하여 맵의 품질과 훈련 과정을 개선하였습니다. 우리의 접근 방식의 일반적인 적용 가능성을 검증하기 위해 네 가지 작업에 대해 광범위한 실험을 수행하였으며, BiRefNet이 모든 벤치마크에서 작업 특화된 최신 방법들을 능가하는 뛰어난 성능을 보임을 입증하였습니다. 우리의 코드는 https://github.com/ZhengPeng7/BiRefNet에서 확인할 수 있습니다.

고해상도 이진 이미지 분할을 위한 양방향 참조 | 최신 연구 논문 | HyperAI초신경