Date

il y a 5 mois

Organisation

URL du document

2512.17495

Licence

Other

Balises

LLM

Multimodal

Traitement Du Langage Naturel

GroundingME est un jeu de données d'évaluation visuelle de référence pour les modèles de langage multimodaux de grande taille (MLLM), publié en 2025 par l'Université Tsinghua en collaboration avec Xiaomi et l'Université de Hong Kong, entre autres institutions. Les articles de recherche associés incluent… GroundingME : Révéler le fossé de l’ancrage visuel dans les MLLM grâce à une évaluation multidimensionnelleL'objectif est d'évaluer systématiquement la capacité du modèle à associer avec précision le langage naturel à des cibles visuelles dans des scénarios complexes du monde réel, en accordant une attention particulière à la compréhension et à la sécurité dans des situations impliquant des références ambiguës, des relations spatiales complexes, de petites cibles, l'occlusion et l'absence de référentialité. Cet ensemble de données contient 1 005 exemples d'évaluation. Les images proviennent de deux ensembles de données de haute qualité, SA-1B et HR-Bench, et seules les images originales ont été utilisées pour la construction des tâches afin d'éviter toute contamination des données. Les exemples couvrent quatre catégories de tâches principales : référence discriminative (204 exemples, TP3T de 20,31 %), compréhension des relations spatiales (300 exemples, TP3T de 29,91 %), scènes à visibilité réduite (300 exemples, TP3T de 29,91 %) et tâche de rejet non référentielle (201 exemples, TP3T de 20,01 %), elles-mêmes subdivisées en 12 sous-tâches secondaires présentant une distribution globale équilibrée. L'ensemble de données comprend 241 classes d'objets du monde réel. Une même image contient un grand nombre d'objets de la même classe, et les instances d'objets occupent généralement une petite proportion de l'image. La longueur des descriptions linguistiques est nettement supérieure à celle des ensembles de données de référence existants, ce qui accroît considérablement la difficulté des tâches de référence visuelle multidimensionnelles.

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

Date

il y a 5 mois

Organisation

URL du document

2512.17495

Licence

Other

Balises

LLM

Multimodal

Traitement Du Langage Naturel

undefined

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a 2 mois

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

il y a 5 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 5 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 5 mois

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

il y a 5 mois

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

undefined

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

undefined

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

undefined

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données d'inférence Mathématique Nemotron-Math-v2

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro