HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'évaluation Multimodale FoMER Bench

Date

il y a 4 mois

Taille

7.03 GB

Organisation

Université nationale australienne
Université de Linköping
Université Mohamed bin Zayed d'intelligence artificielle

URL du document

2509.15293

Licence

Apache 2.0

FoMER Bench est un benchmark Foundational Model Embodied Reasoning (FoMER) publié en 2025 par l'Université Mohamed bin Zayed d'intelligence artificielle, l'Université de Linköping et l'Université nationale australienne.Dans quelle mesure les modèles de base sont-ils efficaces dans le raisonnement incarné étape par étape ?», qui vise à évaluer la capacité de raisonnement du LMM dans des scénarios complexes de prise de décision incarnée.

Cet ensemble de données contient plus de 1 100 exemples, couvrant un raisonnement détaillé étape par étape à travers 10 tâches et 8 tâches de raisonnement incarné. Il englobe trois types de robots et plusieurs modes robotiques, permettant d'évaluer les capacités du LLM pour diverses tâches, telles que la prédiction de l'action suivante, l'affordance de l'action, le bon sens physique, le raisonnement temporel, l'utilisation et la manipulation d'outils, l'évaluation des risques et la navigation du robot. Les données incluent des questions à choix multiples (QCM), des questions vrai/faux (VF) et des questions ouvertes. Chaque exemple est accompagné d'une observation (vidéo ou image + texte), de plusieurs actions candidates et des traces de raisonnement étape par étape correspondantes.

FoMER.torrent
Seeding 2Téléchargement 0Terminé 0Total Downloads 69
  • FoMER/
    • README.md
      1.79 KB
    • README.txt
      3.59 KB
      • data/
        • FoMER.zip
          7.03 GB

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp