HyperAIHyperAI超神経
ホームニュース論文チュートリアルデータセット百科事典SOTALLMモデルGPU ランキング学会
検索
サイトについて
日本語
HyperAIHyperAI超神経
  1. ホーム
  2. SOTA
  3. 視覚的定位
  4. Visual Grounding On Refcoco Testa

Visual Grounding On Refcoco Testa

評価指標

IoU

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
IoU
Paper TitleRepository
HYDRA61.1HYDRA: A Hyper Agent for Dynamic Compositional Visual Reasoning
XFM (base)-Toward Building General Foundation Models for Language, Vision, and Vision-Language Understanding Tasks
X2-VLM (large)-X$^2$-VLM: All-In-One Pre-trained Model For Vision-Language Tasks
X2-VLM (base)-X$^2$-VLM: All-In-One Pre-trained Model For Vision-Language Tasks
X-VLM (base)-Multi-Grained Vision Language Pre-Training: Aligning Texts with Visual Concepts
mPLUG-2-mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video
Florence-2-large-ft-Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks
0 of 7 row(s) selected.
HyperAI

学習、理解、実践、コミュニティと共に人工知能の未来を構築する

日本語

サイトについて

私たちについてデータセットヘルプ

プロダクト

ニュースチュートリアルデータセット百科事典

リンク

TVM 中国語Apache TVMOpenBayes

© HyperAI超神経

TwitterBilibili