HyperAIHyperAI

Command Palette

Search for a command to run...

Console

FoMER Bench Multimodaler Evaluierungsdatensatz

Date

vor 2 Monaten

Size

7.03 GB

Organization

Australian National University
Universität Linköping
Mohamed bin Zayed Universität für Künstliche Intelligenz

Paper URL

2509.15293

License

Apache 2.0

FoMER Bench ist ein Foundational Model Embodied Reasoning (FoMER)-Benchmark, der 2025 von der Mohamed bin Zayed University of Artificial Intelligence, der Universität Linköping und der Australian National University veröffentlicht wurde.Wie gut sind Grundlagenmodelle im schrittweisen Embodied Reasoning?“, dessen Ziel es ist, die Denkfähigkeit von LMM in komplexen verkörperten Entscheidungsszenarien zu bewerten.

Dieser Datensatz enthält über 1.100 Beispiele und deckt detailliertes schrittweises Denken in zehn Aufgaben und acht Aufgaben zum verkörperten Denken ab. Er umfasst drei verschiedene Robotertypen und mehrere Robotermodi und ermöglicht die Bewertung von LLM-Fähigkeiten in verschiedenen Aufgaben, wie z. B. Vorhersage der nächsten Aktion, Handlungsermöglichung, körperlicher Menschenverstand, zeitliches Denken, Werkzeuggebrauch und -manipulation, Risikobewertung und Roboternavigation. Die Daten umfassen Multiple-Choice-Fragen (MCQs), Richtig/Falsch-Fragen (TFs) und offene Fragen. Jedes Beispiel wird von einer Eingabebeobachtung (Video oder Bildrahmen + Textaufforderung), mehreren möglichen Aktionen und entsprechenden schrittweisen Denkspuren begleitet.

FoMER.torrent
Seeding 2Downloading 0Completed 0Total Downloads 24
  • FoMER/
    • README.md
      1.79 KB
    • README.txt
      3.59 KB
      • data/
        • FoMER.zip
          7.03 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp