Datum

vor einem Jahr

Größe

2.41 MB

Organisation

Veröffentlichungs-URL

omni-math.github.io

Paper-URL

arxiv.org

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Omni-MATH ist ein von der Peking-Universität und Alibaba entwickelter Benchmark-Datensatz für mathematisches Denken auf Olympiaden-Niveau, der die Leistung großer Sprachmodelle (LLMs) bei mathematischen Problemen auf Olympiaden-Niveau bewerten soll. Die relevanten Papierergebnisse sindOmni-MATH: Ein universeller mathematischer Benchmark auf Olympiadenniveau für große Sprachmodelle".

Dieser Datensatz enthält 4.428 sorgfältig manuell annotierte Mathematikaufgaben auf Wettbewerbsniveau, die 33 Unterbereiche und mehr als 10 verschiedene Schwierigkeitsgrade abdecken, vom Vorbereitungsniveau für die Olympiade bis hin zu den wichtigsten Mathematikwettbewerben der Olympiade wie der IMO (International Mathematical Olympiad), der IMC (International Mathematical Contest) und der Putnam Mathematics Competition.

Der Erstellungsprozess von Omni-MATH umfasst das Sammeln von Daten aus globalen Mathematikwettbewerben und deren Überprüfung durch menschliche Anmerkungen, um die hohe Qualität und Vielfalt der Daten sicherzustellen. Während der Erstellung des Datensatzes verwendete das Forschungsteam GPT-4o, um die Fragen zu klassifizieren und in verschiedene mathematische Felder zu unterteilen, um die Leistung des Modells in verschiedenen mathematischen Feldern zu bewerten.

Omni-MATH.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 143Gesamtdownloads 243

Omni-MATH/
- README.md
  1.73 KB
- README.txt
  3.46 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor einem Jahr

Größe

2.41 MB

Organisation

Veröffentlichungs-URL

omni-math.github.io

Paper-URL

arxiv.org

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Omni-MATH.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 143Gesamtdownloads 243

Omni-MATH/
- README.md
  1.73 KB
- README.txt
  3.46 KB

Verwandt Datensätze

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

vor 25 Tagen

Nemotron-Math-Proofs-v1 Datensatz Für Formale Mathematische Beweise

vor einem Monat

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

vor 3 Monaten

9.71 GB69

FrontierScience Inference Research Task Evaluation Dataset

vor 2 Monaten

NAMD_Benchmark Molekulardynamik-Leistungsbenchmark-Datensatz

vor 3 Monaten

FineReason Multimodaler Datensatz Für Visuelles Denken

vor 3 Monaten

65.85 GB78

OpenGU Graph Forgetting Comprehensive Evaluation Dataset

vor 2 Monaten

CL-bench Kontextlern-Evaluierungsbenchmark

vor 5 Tagen

olmOCR-mix-1025 Dokumentenerkennungsdatensatz

vor 3 Monaten

71.74 GB82

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Omni-MATH Benchmark-Datensatz Für Mathematisches Denken

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Omni-MATH Benchmark-Datensatz Für Mathematisches Denken

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Verwandt Datensätze

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

Nemotron-Math-Proofs-v1 Datensatz Für Formale Mathematische Beweise

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

FrontierScience Inference Research Task Evaluation Dataset

NAMD_Benchmark Molekulardynamik-Leistungsbenchmark-Datensatz

FineReason Multimodaler Datensatz Für Visuelles Denken

OpenGU Graph Forgetting Comprehensive Evaluation Dataset

CL-bench Kontextlern-Evaluierungsbenchmark

olmOCR-mix-1025 Dokumentenerkennungsdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Omni-MATH Benchmark-Datensatz Für Mathematisches Denken

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Verwandt Datensätze

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

Nemotron-Math-Proofs-v1 Datensatz Für Formale Mathematische Beweise

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

FrontierScience Inference Research Task Evaluation Dataset

NAMD_Benchmark Molekulardynamik-Leistungsbenchmark-Datensatz

FineReason Multimodaler Datensatz Für Visuelles Denken

OpenGU Graph Forgetting Comprehensive Evaluation Dataset

CL-bench Kontextlern-Evaluierungsbenchmark

olmOCR-mix-1025 Dokumentenerkennungsdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Verwandt Datensätze

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

Nemotron-Math-Proofs-v1 Datensatz Für Formale Mathematische Beweise

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

FrontierScience Inference Research Task Evaluation Dataset

NAMD_Benchmark Molekulardynamik-Leistungsbenchmark-Datensatz

FineReason Multimodaler Datensatz Für Visuelles Denken

OpenGU Graph Forgetting Comprehensive Evaluation Dataset

CL-bench Kontextlern-Evaluierungsbenchmark

olmOCR-mix-1025 Dokumentenerkennungsdatensatz

Verwandt Datensätze

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

Nemotron-Math-Proofs-v1 Datensatz Für Formale Mathematische Beweise

UNO-Bench Benchmark-Datensatz Für Die Vollständige Modalbewertung

FrontierScience Inference Research Task Evaluation Dataset

NAMD_Benchmark Molekulardynamik-Leistungsbenchmark-Datensatz

FineReason Multimodaler Datensatz Für Visuelles Denken

OpenGU Graph Forgetting Comprehensive Evaluation Dataset

CL-bench Kontextlern-Evaluierungsbenchmark

olmOCR-mix-1025 Dokumentenerkennungsdatensatz