HyperAIHyperAI

Command Palette

Search for a command to run...

Console

Ensemble De Données d'évaluation Multimodale FoMER Bench

Date

il y a 2 mois

Size

7.03 GB

Organization

Université nationale australienne
Université de Linköping
Université Mohamed bin Zayed d'intelligence artificielle

Paper URL

2509.15293

License

Apache 2.0

FoMER Bench est un benchmark Foundational Model Embodied Reasoning (FoMER) publié en 2025 par l'Université Mohamed bin Zayed d'intelligence artificielle, l'Université de Linköping et l'Université nationale australienne.Dans quelle mesure les modèles de base sont-ils efficaces dans le raisonnement incarné étape par étape ?», qui vise à évaluer la capacité de raisonnement du LMM dans des scénarios complexes de prise de décision incarnée.

Cet ensemble de données contient plus de 1 100 exemples, couvrant un raisonnement détaillé étape par étape à travers 10 tâches et 8 tâches de raisonnement incarné. Il englobe trois types de robots et plusieurs modes robotiques, permettant d'évaluer les capacités du LLM pour diverses tâches, telles que la prédiction de l'action suivante, l'affordance de l'action, le bon sens physique, le raisonnement temporel, l'utilisation et la manipulation d'outils, l'évaluation des risques et la navigation du robot. Les données incluent des questions à choix multiples (QCM), des questions vrai/faux (VF) et des questions ouvertes. Chaque exemple est accompagné d'une observation (vidéo ou image + texte), de plusieurs actions candidates et des traces de raisonnement étape par étape correspondantes.

FoMER.torrent
Seeding 2Downloading 0Completed 0Total Downloads 24
  • FoMER/
    • README.md
      1.79 KB
    • README.txt
      3.59 KB
      • data/
        • FoMER.zip
          7.03 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp