Referring Expression Segmentation
تهدف تقنية تقسيم التعبيرات الإشارية إلى إجراء تسمية على مستوى البكسل لحالات كائنات محددة في الصور أو الفيديوهات من خلال التعبيرات اللغوية. يتطلب هذا المهمة أن يكون التعبير الإشاري قادراً على تحديد الكائن المستهدف بشكل فريد في المشهد أو الحوار، مما يضمن دقة وفريدة من نوعها للتسمية. لهذه التقنية قيمة تطبيقية كبيرة في التفاعل بين الإنسان والكمبيوتر، تحرير الصور، وفهم المحتوى.
A2D Sentences
SgMg (Video-Swin-B)
A2Dre test
RefVos
CLEVR-Ref+
IEP-Ref (700K prog.)
DAVIS 2017 (val)
RefVOS
G-Ref test B
G-Ref val
J-HMDB
SgMg (Video-Swin-B)
PhraseCut
MDETR ENB3
RefCOCO
DETRIS
RefCOCO+ test B
RefCOCO testA
RefCOCO+ testA
HyperSeg
RefCOCO testB
EVP
RefCoCo val
CRIS
RefCOCO+ val
HyperSeg
RefCOCOg-test
UniLSeg-100
RefCOCOg-val
MLCD-Seg-7B
Refer-YouTube-VOS
RefVOS-Human REs
Refer-YouTube-VOS (2021 public validation)
GLEE-Pro
ReferIt
PolyFormer-L
Referring Expressions for DAVIS 2016 & 2017
MUTR