Referring Expression Segmentation
Referring Expression Segmentation은 언어 표현을 통해 이미지나 비디오에서 특정 객체 인스턴스의 픽셀 단위 주석을 수행하는 것을 목표로 합니다. 이 작업은 referring expression(RE)이 장면이나 대화에서 목표 객체를 유일하게 식별할 수 있어야 하며, 이는 주석의 정확성과 독특성을 보장해야 함을 의미합니다. 이 기술은 인간-컴퓨터 상호작용, 이미지 편집, 및 콘텐츠 이해 분야에서 중요한 응용 가치를 가지고 있습니다.
A2D Sentences
SgMg (Video-Swin-B)
A2Dre test
RefVos
CLEVR-Ref+
IEP-Ref (700K prog.)
DAVIS 2017 (val)
RefVOS
G-Ref test B
G-Ref val
J-HMDB
SgMg (Video-Swin-B)
PhraseCut
MDETR ENB3
RefCOCO
DETRIS
RefCOCO+ test B
RefCOCO testA
RefCOCO+ testA
HyperSeg
RefCOCO testB
EVP
RefCoCo val
CRIS
RefCOCO+ val
HyperSeg
RefCOCOg-test
UniLSeg-100
RefCOCOg-val
MLCD-Seg-7B
Refer-YouTube-VOS
RefVOS-Human REs
Refer-YouTube-VOS (2021 public validation)
GLEE-Pro
ReferIt
PolyFormer-L
Referring Expressions for DAVIS 2016 & 2017
MUTR