HyperAIHyperAI

Command Palette

Search for a command to run...

FoMER Bench Multimodaler Evaluierungsdatensatz

Datum

vor 4 Monaten

Größe

7.03 GB

Organisation

Australian National University
Universität Linköping
Mohamed bin Zayed Universität für Künstliche Intelligenz

Paper-URL

2509.15293

Lizenz

Apache 2.0

FoMER Bench ist ein Foundational Model Embodied Reasoning (FoMER)-Benchmark, der 2025 von der Mohamed bin Zayed University of Artificial Intelligence, der Universität Linköping und der Australian National University veröffentlicht wurde.Wie gut sind Grundlagenmodelle im schrittweisen Embodied Reasoning?“, dessen Ziel es ist, die Denkfähigkeit von LMM in komplexen verkörperten Entscheidungsszenarien zu bewerten.

Dieser Datensatz enthält über 1.100 Beispiele und deckt detailliertes schrittweises Denken in zehn Aufgaben und acht Aufgaben zum verkörperten Denken ab. Er umfasst drei verschiedene Robotertypen und mehrere Robotermodi und ermöglicht die Bewertung von LLM-Fähigkeiten in verschiedenen Aufgaben, wie z. B. Vorhersage der nächsten Aktion, Handlungsermöglichung, körperlicher Menschenverstand, zeitliches Denken, Werkzeuggebrauch und -manipulation, Risikobewertung und Roboternavigation. Die Daten umfassen Multiple-Choice-Fragen (MCQs), Richtig/Falsch-Fragen (TFs) und offene Fragen. Jedes Beispiel wird von einer Eingabebeobachtung (Video oder Bildrahmen + Textaufforderung), mehreren möglichen Aktionen und entsprechenden schrittweisen Denkspuren begleitet.

FoMER.torrent
Seeding 1Wird heruntergeladen 0Abgeschlossen 1Gesamtdownloads 69
  • FoMER/
    • README.md
      1.79 KB
    • README.txt
      3.59 KB
      • data/
        • FoMER.zip
          7.03 GB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp