참조 표현 분할
Referring Expression Segmentation은 언어 표현을 통해 이미지나 비디오에서 특정 객체 인스턴스의 픽셀 단위 주석을 수행하는 것을 목표로 합니다. 이 작업은 referring expression(RE)이 장면이나 대화에서 목표 객체를 유일하게 식별할 수 있어야 하며, 이는 주석의 정확성과 독특성을 보장해야 함을 의미합니다. 이 기술은 인간-컴퓨터 상호작용, 이미지 편집, 및 콘텐츠 이해 분야에서 중요한 응용 가치를 가지고 있습니다.
RefCoCo val
CRIS
Refer-YouTube-VOS (2021 public validation)
GLEE-Pro
RefCOCO+ val
HyperSeg
RefCOCO+ testA
LAVT
RefCOCO+ test B
A2D Sentences
ACGA
J-HMDB
SgMg (Video-Swin-B)
RefCOCOg-val
MLCD-Seg-7B
DAVIS 2017 (val)
RefVOS
RefCOCOg-test
PolyFormer-L
RefCOCO testA
RefCOCO testB
EVP
PhraseCut
MDETR ENB3
RefCOCO
DETRIS
ReferIt
PolyFormer-L
Refer-YouTube-VOS
RefVOS-Human REs
Referring Expressions for DAVIS 2016 & 2017
MUTR
A2Dre test
RefVos
CLEVR-Ref+
IEP-Ref (700K prog.)
G-Ref val
G-Ref test B