HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Référence Pour l'évaluation Multimodale UNO-Bench

Date

il y a 2 mois

Size

9.71 GB

Organization

Meituan

Paper URL

2510.18915

License

MIT

UNO-Bench est le premier banc d'essai d'évaluation multimodale unifié publié par l'équipe LongCat de Meituan en 2025. L'article associé s'intitule « UNO-Bench : un banc d’essai unifié pour explorer la loi de composition entre les modèles unimodaux et omnimodaux dans les modèles omniL'objectif est d'évaluer efficacement les capacités de compréhension unimodales et multimodales.

Cet ensemble de données contient 1 250 exemples multimodaux complets (avec une solvabilité intermodale de 98%) et 2 480 exemples unimodaux, couvrant 44 types de tâches et 5 combinaisons de modalités. Il inclut également un modèle de notation général permettant l’évaluation automatisée de 6 types de questions, offrant ainsi une norme d’évaluation unifiée pour les tâches multimodales. Les exemples multimodaux complets ont été soigneusement élaborés par des humains afin de refléter au mieux les applications réelles, et sont particulièrement adaptés au contexte chinois. Les exemples unimodaux complètent les dimensions cognitives et d’aptitudes fondamentales, rendant l’évaluation globale plus exhaustive.

Structures de données :

Les données sont stockées au format Parquet, et chaque échantillon contient des champs structurés :

  • qid (identifiant de l'échantillon), nom_du_sous-ensemble (nom du sous-ensemble) ;
  • question (question textuelle) et réponse (réponse standard) ;
  • images / audios / vidéos (contenu multimodal, les chemins d'accès aux fichiers sont stockés sous forme de dictionnaire, null si absent) ;
  • tâche (44 étiquettes de tâche), capacité (type de capacité), source (source de données), type_de_score (méthode de notation).
Exemple d'ensemble de données
UNO-Bench.torrent
Seeding 2Downloading 0Completed 1Total Downloads 49
  • UNO-Bench/
    • README.md
      1.97 KB
    • README.txt
      3.93 KB
      • data/
        • UNO-Bench.zip
          9.71 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp