HyperAIHyperAI초신경
홈뉴스연구 논문튜토리얼데이터셋백과사전SOTALLM 모델GPU 랭킹컨퍼런스
전체 검색
소개
한국어
HyperAIHyperAI초신경
  1. 홈
  2. SOTA
  3. 시각적 정지점
  4. Visual Grounding On Refcoco Testa

Visual Grounding On Refcoco Testa

평가 지표

IoU

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름
IoU
Paper TitleRepository
HYDRA61.1HYDRA: A Hyper Agent for Dynamic Compositional Visual Reasoning
XFM (base)-Toward Building General Foundation Models for Language, Vision, and Vision-Language Understanding Tasks
X2-VLM (large)-X$^2$-VLM: All-In-One Pre-trained Model For Vision-Language Tasks
X2-VLM (base)-X$^2$-VLM: All-In-One Pre-trained Model For Vision-Language Tasks
X-VLM (base)-Multi-Grained Vision Language Pre-Training: Aligning Texts with Visual Concepts
mPLUG-2-mPLUG-2: A Modularized Multi-modal Foundation Model Across Text, Image and Video
Florence-2-large-ft-Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks
0 of 7 row(s) selected.
HyperAI

학습, 이해, 실천, 커뮤니티와 함께 인공지능의 미래를 구축하다

한국어

소개

회사 소개데이터셋 도움말

제품

뉴스튜토리얼데이터셋백과사전

링크

TVM 한국어Apache TVMOpenBayes

© HyperAI초신경

TwitterBilibili