HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence d'évaluation Multimodale M2RAG

Date

il y a 7 mois

Taille

5.46 GB

Organisation

URL de l'article

arxiv.org

M2RAG est un ensemble de données multimodales permettant d'évaluer les capacités des grands modèles linguistiques multimodaux (MLLM) dans des scénarios de recherche multimodale. Il vise à évaluer la capacité des MLLM à utiliser les connaissances documentaires de recherche multimodale dans des tâches telles que la description d'images, la réponse aux questions multimodales, la vérification des faits et le reclassement des images. Les résultats pertinents de l'article sontAnalyse comparative de la génération augmentée par récupération dans des contextes multimodaux".

Cet ensemble de données combine des données d'image et de texte pour simuler des tâches de recherche et de génération d'informations dans des scénarios réels, tels que l'analyse d'événements d'actualité et la réponse visuelle à des questions. Il se concentre sur l'évaluation de la capacité des MLLM à utiliser les connaissances documentaires récupérées dans des contextes multimodaux, y compris la compréhension du contenu de l'image, le raisonnement par association image-texte et le jugement des faits.

Exemple de tâche de référence M2RAG
M2RAG.torrent
Partage 1Téléchargement 0Terminés 87Téléchargements totaux 155
  • M2RAG/
    • README.md
      1.45 KB
    • README.txt
      2.9 KB
      • data/
        • M2RAG.zip
          5.46 GB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données De Référence d'évaluation Multimodale M2RAG | Ensembles de données | HyperAI