HyperAIHyperAI

Command Palette

Search for a command to run...

U-MATH-Datensatz Für Mathematisches Denken

Datum

vor einem Jahr

Größe

5.43 MB

Organisation

Paper-URL

arxiv.org

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Der U-MATH-Datensatz ist ein umfassender Benchmark-Testsatz, der speziell zur Bewertung der mathematischen Argumentationsfähigkeiten großer Sprachmodelle (LLMs) entwickelt wurde. Dieser Datensatz wurde 2024 von Toloka AI und Gradarius erstellt. Die relevanten Ergebnisse des Papiers sind:U-MATH: Ein universitärer Benchmark zur Bewertung mathematischer Fähigkeiten in LLMs". Dieser Datensatz enthält 1.100 unveröffentlichte Mathematikaufgaben auf College-Niveau, die aus authentischen Unterrichtsmaterialien stammen und sechs Kernthemen der Mathematik abdecken: Elementarmathematik, Algebra, Differentialrechnung, Integralrechnung, Analysis mit mehreren Variablen sowie Folgen und Reihen.

Ein bemerkenswertes Merkmal des U-MATH-Datensatzes sind die darin enthaltenen multimodalen Fragen. Etwa 20% der Fragen beinhalten visuelle Elemente wie Grafiken und Diagramme, was die Komplexität der Datenverarbeitung erhöht und erfordert, dass das Modell in der Lage ist, grafische Informationen zu interpretieren und zu begründen. Zu den Merkmalen des Datensatzes gehören die Frage-ID, Themen-Tags, ob er Bilder, Bilddaten, Fragestellungen und richtige Antworten enthält, die eine umfassende Bewertungsgrundlage für die mathematische Argumentationsfähigkeit des Modells bieten.

U-MATH.torrent
Seeding 1Herunterladen 0Abgeschlossen 130Gesamtdownloads 222
  • U-MATH/
    • README.md
      1.68 KB
    • README.txt
      3.35 KB
      • data/
        • u-math.zip
          5.43 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
U-MATH-Datensatz Für Mathematisches Denken | Datensätze | HyperAI