Referring Expression Segmentation
コンピュータビジョンは、機械が画像や動画を解釈し理解する技術です。この技術の目的は、人間の視覚システムを模倣することで複雑なシーンの自動認識と分析を達成することです。コンピュータビジョンは医療画像診断、自動運転、セキュリティ監視などの分野で広く応用されており、効率と精度を大幅に向上させ、知能社会の発展に貢献しています。
A2D Sentences
SgMg (Video-Swin-B)
A2Dre test
RefVos
CLEVR-Ref+
IEP-Ref (700K prog.)
DAVIS 2017 (val)
RefVOS
G-Ref test B
G-Ref val
J-HMDB
SgMg (Video-Swin-B)
PhraseCut
MDETR ENB3
RefCOCO
DETRIS
RefCOCO+ test B
RefCOCO testA
RefCOCO+ testA
HyperSeg
RefCOCO testB
EVP
RefCoCo val
CRIS
RefCOCO+ val
HyperSeg
RefCOCOg-test
UniLSeg-100
RefCOCOg-val
MLCD-Seg-7B
Refer-YouTube-VOS
RefVOS-Human REs
Refer-YouTube-VOS (2021 public validation)
GLEE-Pro
ReferIt
PolyFormer-L
Referring Expressions for DAVIS 2016 & 2017
MUTR