HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Date

il y a 4 heures

Organization

L'Université de Hong Kong
Université Tsinghua
Xiaomi

Paper URL

2512.17495

License

Other

GroundingME 是由清华大学联合小米和香港大学等机构于 2025 年发布的一个面向多模态大语言模型(MLLMs)的视觉指代评测数据集,相关论文成果为 GroundingME: Exposing the Visual Grounding Gap in MLLMs through Multi-Dimensional Evaluation,旨在系统评估模型在真实复杂场景中将自然语言准确映射到视觉目标的能力,尤其关注歧义指代、复杂空间关系、小目标、遮挡以及不可指代情形下的理解与安全表现。

该数据集共包含 1,005 条评测样本,图像来源于 SA-1B 与 HR-Bench 两个高质量数据集,仅使用原始图像构建任务以避免数据污染。样本覆盖 4 个一级任务类别,分别为区分性指代(204 条,20.3%)、空间关系理解(300 条,29.9%)、受限可见性场景(300 条,29.9%)以及不可指代拒绝任务(201 条,20.0%),并进一步细分为 12 个二级子任务,整体分布均衡。数据集中共涉及 241 类真实物体,单幅图像中同类目标数量较多,目标实例通常占图像比例较小,且语言描述长度显著高于现有指代数据集,从多个维度显著提升了视觉指代任务的难度。

Exemple d'ensemble de données

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp