HyperAIHyperAI

Command Palette

Search for a command to run...

U-MATH-Datensatz Für Mathematisches Denken

Date

vor einem Jahr

Size

5.43 MB

Organization

Paper URL

arxiv.org

Der U-MATH-Datensatz ist ein umfassender Benchmark-Testsatz, der speziell zur Bewertung der mathematischen Argumentationsfähigkeiten großer Sprachmodelle (LLMs) entwickelt wurde. Dieser Datensatz wurde 2024 von Toloka AI und Gradarius erstellt. Die relevanten Ergebnisse des Papiers sind:U-MATH: Ein universitärer Benchmark zur Bewertung mathematischer Fähigkeiten in LLMs". Dieser Datensatz enthält 1.100 unveröffentlichte Mathematikaufgaben auf College-Niveau, die aus authentischen Unterrichtsmaterialien stammen und sechs Kernthemen der Mathematik abdecken: Elementarmathematik, Algebra, Differentialrechnung, Integralrechnung, Analysis mit mehreren Variablen sowie Folgen und Reihen.

Ein bemerkenswertes Merkmal des U-MATH-Datensatzes sind die darin enthaltenen multimodalen Fragen. Etwa 20% der Fragen beinhalten visuelle Elemente wie Grafiken und Diagramme, was die Komplexität der Datenverarbeitung erhöht und erfordert, dass das Modell in der Lage ist, grafische Informationen zu interpretieren und zu begründen. Zu den Merkmalen des Datensatzes gehören die Frage-ID, Themen-Tags, ob er Bilder, Bilddaten, Fragestellungen und richtige Antworten enthält, die eine umfassende Bewertungsgrundlage für die mathematische Argumentationsfähigkeit des Modells bieten.

U-MATH.torrent
Seeding 1Downloading 0Completed 143Total Downloads 263
  • U-MATH/
    • README.md
      1.68 KB
    • README.txt
      3.35 KB
      • data/
        • u-math.zip
          5.43 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp