Date

il y a 4 mois

Taille

7.03 GB

Organisation

URL du document

2509.15293

Licence

Apache 2.0

Balises

Intelligence Incarnée

Reconnaissance D'action

FoMER Bench est un benchmark Foundational Model Embodied Reasoning (FoMER) publié en 2025 par l'Université Mohamed bin Zayed d'intelligence artificielle, l'Université de Linköping et l'Université nationale australienne.Dans quelle mesure les modèles de base sont-ils efficaces dans le raisonnement incarné étape par étape ?», qui vise à évaluer la capacité de raisonnement du LMM dans des scénarios complexes de prise de décision incarnée.

Cet ensemble de données contient plus de 1 100 exemples, couvrant un raisonnement détaillé étape par étape à travers 10 tâches et 8 tâches de raisonnement incarné. Il englobe trois types de robots et plusieurs modes robotiques, permettant d'évaluer les capacités du LLM pour diverses tâches, telles que la prédiction de l'action suivante, l'affordance de l'action, le bon sens physique, le raisonnement temporel, l'utilisation et la manipulation d'outils, l'évaluation des risques et la navigation du robot. Les données incluent des questions à choix multiples (QCM), des questions vrai/faux (VF) et des questions ouvertes. Chaque exemple est accompagné d'une observation (vidéo ou image + texte), de plusieurs actions candidates et des traces de raisonnement étape par étape correspondantes.

FoMER.torrent

Seeding 2Téléchargement 0Terminé 1Total Downloads 69

FoMER/
- README.md
  1.79 KB
- README.txt
  3.59 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

Associé Jeux de données

Ensemble De Données De Référence Pour l'évaluation Multimodale UNO-Bench

il y a 3 mois

9.71 GB69

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

il y a 2 mois

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

il y a 3 mois

25.58 GB60

Banc d'évaluation De l'apprentissage Contextuel CL-bench

il y a 5 jours

Ensemble De Données d'évaluation De l'animation Humaine Pilotée Par l'audio Soul-Bench

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 4 mois

Taille

7.03 GB

Organisation

URL du document

2509.15293

Licence

Apache 2.0

Balises

Intelligence Incarnée

Reconnaissance D'action

FoMER.torrent

Seeding 2Téléchargement 0Terminé 1Total Downloads 69

FoMER/
- README.md
  1.79 KB
- README.txt
  3.59 KB

Associé Jeux de données

Ensemble De Données De Référence Pour l'évaluation Multimodale UNO-Bench

il y a 3 mois

9.71 GB69

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

il y a 2 mois

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

il y a 3 mois

25.58 GB60

Banc d'évaluation De l'apprentissage Contextuel CL-bench

il y a 5 jours

Ensemble De Données d'évaluation De l'animation Humaine Pilotée Par l'audio Soul-Bench

il y a 2 mois

Ensemble De Données d'évaluation De La Modification d'images EditReward-Bench

il y a 3 mois

5.08 GB61

Ensemble De Données De Simulation d'intelligence Incarnée TongSIM-Asset

il y a un mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a 5 jours

Ensemble De Données Des Tâches De l'outil Physique PhysToolBench

il y a 2 mois

1.56 GB56

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données d'évaluation Multimodale FoMER Bench

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation Multimodale FoMER Bench

Associé Jeux de données

Ensemble De Données De Référence Pour l'évaluation Multimodale UNO-Bench

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

Banc d'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'évaluation De l'animation Humaine Pilotée Par l'audio Soul-Bench

Ensemble De Données d'évaluation De La Modification d'images EditReward-Bench

Ensemble De Données De Simulation d'intelligence Incarnée TongSIM-Asset

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Des Tâches De l'outil Physique PhysToolBench

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'évaluation Multimodale FoMER Bench

Associé Jeux de données

Ensemble De Données De Référence Pour l'évaluation Multimodale UNO-Bench

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

Banc d'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'évaluation De l'animation Humaine Pilotée Par l'audio Soul-Bench

Ensemble De Données d'évaluation De La Modification d'images EditReward-Bench

Ensemble De Données De Simulation d'intelligence Incarnée TongSIM-Asset

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Des Tâches De l'outil Physique PhysToolBench

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Jeux de données

Ensemble De Données De Référence Pour l'évaluation Multimodale UNO-Bench

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

Banc d'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'évaluation De l'animation Humaine Pilotée Par l'audio Soul-Bench

Ensemble De Données d'évaluation De La Modification d'images EditReward-Bench

Ensemble De Données De Simulation d'intelligence Incarnée TongSIM-Asset

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Des Tâches De l'outil Physique PhysToolBench

Associé Jeux de données

Ensemble De Données De Référence Pour l'évaluation Multimodale UNO-Bench

Ensemble De Données De Référence Pour La Compréhension d'images Infrarouges IF-Bench

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

Banc d'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données d'évaluation De l'animation Humaine Pilotée Par l'audio Soul-Bench

Ensemble De Données d'évaluation De La Modification d'images EditReward-Bench

Ensemble De Données De Simulation d'intelligence Incarnée TongSIM-Asset

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Des Tâches De l'outil Physique PhysToolBench