Command Palette
Search for a command to run...
Eine Sammlung Von 7 Wichtigen Datensätzen Zum Mathematischen Denken, Die Arithmetisches Denken/symbolische Logik/visuelle Mathematik/geometrische Analyse Abdecken

Mit der rasanten Weiterentwicklung der Möglichkeiten zur Erstellung groß angelegter Modelle entwickelt sich mathematisches Denken von einer rein menschlichen Denkleistung zu einer der größten Herausforderungen der künstlichen Intelligenz. Aufgaben, die früher auf menschlicher Rationalität beruhten, wie logisches Deduzieren, Formelberechnungen und mehrstufiges Denken, werden heute nach und nach von Maschinen „verstanden“ und „erlernt“.Anders als beim Sprachverständnis oder bei der Bilderkennung erfordert das mathematische Denken jedoch, dass das Modell nicht nur die oberflächliche Bedeutung der Frage versteht, sondern auch Einblick in die logische Struktur dahinter hat. Daher hängt die Leistung des Modells besonders stark von der Datenqualität ab.
Die Weiterentwicklung von Modellen von der Berechnung zur Schlussfolgerung erfordert die Unterstützung hochwertiger, strukturierter und logisch kohärenter Daten. Ein systematischer, hierarchischer und logisch konsistenter Datensatz bestimmt nicht nur, ob ein Modell die Denkprinzipien hinter abstrakten Symbolen erfassen kann, sondern beeinflusst auch seine Fähigkeit zur Generalisierung und Selbstkorrektur in offenen Umgebungen.Im Vergleich zu allgemeinen Korpora natürlicher Sprache legen mathematische Schlussfolgerungsdatensätze mehr Wert auf die Vielfalt der Problemverteilung, die Erklärbarkeit von Problemlösungspfaden und die vollständige Annotation von Schlussfolgerungsketten, um sicherzustellen, dass der Lernprozess des Modells dem menschlichen Denken so nahe wie möglich kommt.
Gesamt,Mathematisches Denken wird für die künstliche Intelligenz zu einem Schlüsselfenster auf dem Weg hin zu einer „erklärbaren Intelligenz“.Um die Forschung und Anwendung in diesem Bereich zu fördern, hat HyperAI eine Reihe von Datensätzen zum mathematischen Denken von führenden Institutionen und Unternehmen auf der ganzen Welt zusammengestellt, darunter die Zhejiang University, die University of Hong Kong, NVIDIA, OpenAI und Alibaba, die mehrere Bereiche abdecken, darunter visuelle Mathematik und geometrische Analyse.
Klicken Sie hier, um weitere Open-Source-Datensätze anzuzeigen:
Zusammenfassung des Datensatzes zum mathematischen Denken
1. We-Math2.0-Standard Benchmark-Datensatz
Geschätzte Größe:369,86 MB
Downloadadresse:https://go.hyper.ai/1dAZ2
We-Math2.0-Standard ist ein Standarddatensatz für visuelles mathematisches Denken, der 2025 von der Beijing University of Posts and Telecommunications, Tencent und der Tsinghua University veröffentlicht wurde. Das zugehörige Dokument trägt den Titel „WE-MATH 2.0: Ein vielseitiges MathBook-System zur Förderung visuellen mathematischen Denkens“. Es soll eine diagnostizierbare, erklärbare und vergleichbare Bewertungsgrundlage bieten.
Papieradresse:
https://hyper.ai/en/papers/2508.10433
Dieser Datensatz bildet einen einheitlichen Beschriftungsraum um 1.819 präzise definierte Wissensprinzipien, wobei jede Frage explizit mit dem Prinzip annotiert und sorgfältig kuratiert wird. Dadurch wird insgesamt eine breite und ausgewogene Abdeckung erreicht, insbesondere mathematische Teilgebiete und Fragetypen, die bisher unterrepräsentiert waren. Der Datensatz verfolgt ein duales Erweiterungsdesign:
* Zunächst werden mehrere Bilder pro Frage verwendet, um die Integration und Ausrichtung visueller Beweise aus mehreren Quellen zu testen.
* Zweitens werden mehrere Fragen pro Bild verwendet, um die Übertragung mehrerer Prinzipien und die konzeptionelle Flexibilität im selben visuellen Kontext zu testen.
Jedes Beispiel besteht aus einem Bild und einem Textstamm und wird von Anmerkungen zu den Wissensprinzipien und Standardantworten begleitet, auf denen die Frage beruht.
2. NuminaMath-LEAN-Datensatz für mathematische Probleme
Geschätzte Größe:65,06 MB
Downloadadresse:https://go.hyper.ai/BfJFv
NuminaMath-LEAN ist ein mathematischer Problemdatensatz, der 2025 gemeinsam von Numina und dem Kimi-Team veröffentlicht wurde. Das zugehörige Papier trägt den Titel „Kimina-Prover Preview: Towards Large Formal Reasoning Models with Reinforcement Learning“. Ziel ist es, manuell annotierte formale Aussagen und Beweise für das Training und die Evaluierung automatisierter Theorembeweismodelle bereitzustellen.
Papieradresse:
https://hyper.ai/en/papers/2504.11354
Dieser Datensatz enthält 100.000 Mathematikwettbewerbsaufgaben, darunter auch Aufgaben aus renommierten Wettbewerben wie der Internationalen Mathematik-Olympiade (IMO) und der US-amerikanischen Mathematik-Olympiade (USAMO). Die Datentypen umfassen Problemstellungen, Fragetypklassifizierungen, Antworten, Quellen, formale Beweise, Anmerkungsinformationen und Aufzeichnungen des Trainingsprozesses für bestärkendes Lernen.
3. T-Wix Russischer SFT-Datensatz
Geschätzte Größe:1,43 GB
Downloadadresse:https://go.hyper.ai/5XULu
T-Wix ist ein russischer SFT-Datensatz. Das zugehörige Papier trägt den Titel „Von Quantität zu Qualität: Steigerung der LLM-Leistung durch selbstgesteuerte Datenauswahl zur Anweisungsoptimierung“, dessen Ziel es ist, die Fähigkeiten des Modells von der Lösung algorithmischer und mathematischer Probleme bis hin zu Dialogen, logischem Denken und Argumentationsmustern zu verbessern.
Papieradresse:
https://arxiv.org/abs/2308.12032
Der Datensatz enthält 499.598 russische Sprachproben, darunter 468.614 allgemeine Proben aus verschiedenen Bereichen wie Mathematik, Naturwissenschaften, Programmierung, Allgemeinwissen, Unterrichtsbefolgen und Rollenspiele. Die Beispiele zum Schlussfolgerungsvermögen enthalten 30.984 Datenpunkte, die sich auf fortgeschrittene mathematische und naturwissenschaftliche Probleme konzentrieren und detaillierte Schlussfolgerungsspuren liefern.
4. Nemotron-Math-HumanReasoning-Datensatz zum mathematischen Denken
Geschätzte Größe:639,91 KB
Downloadadresse:https://go.hyper.ai/28kjP
Nemotron-Math-HumanReasoning ist ein mathematischer Datensatz zum Schlussfolgerungsdenken, der 2025 von NVIDIA veröffentlicht wurde. Das zugehörige Ergebnis der Arbeit lautet „Die Herausforderung, LLMs das Schlussfolgerungsdenken ohne RL oder Destillation beizubringen“, dessen Ziel darin besteht, den erweiterten Schlussfolgerungsstil von Modellen wie DeepSeek-R1 zu simulieren.
Papieradresse:
https://arxiv.org/abs/2507.09850
Der Datensatz enthält 50 mathematische Probleme aus dem OpenMathReasoning-Datensatz, 200 von Menschen geschriebene Lösungen und weitere 50 von QwQ-32B-Preview generierte Lösungen.
5. Open-Omega-Atom-1.5M-Datensatz
Geschätzte Größe:6,6 GB
Downloadadresse:https://go.hyper.ai/bndWW
Open-Omega-Atom-1.5M ist ein Datensatz zum folgerichtigen Denken in Mathematik und Naturwissenschaften, der die Denkfähigkeiten in Mathematik und Naturwissenschaften verbessern soll.
Der Datensatz enthält etwa 1,5 Millionen Daten und ist für Mathematik-, Wissenschafts- und Codeanwendungen konzipiert, wobei mathematische Daten einen wichtigen Teil seiner Zusammensetzung ausmachen.
Datensatzfunktionen:
* Prägnant und hochwertig: Konzentrieren Sie sich auf klare, herausfordernde Probleme und schrittweise Lösungen.
* MINT-Fokus: Integriert Mathematik, Code-Argumentation und wissenschaftliches Denken mit einem Mathematik-Hauptfach.
* Kuratiert und optimiert: Die Daten werden selektiv aus hochwertigen offenen Datensätzen und benutzerdefinierten Daten bezogen, um optimale Vielfalt und Kohärenz zu erreichen.
* Geeignet für logisches Denken: deckt die schrittweise und logikbasierte Problemlösung umfassend ab und kann als Benchmark für logische Denkmaschinen dienen.
6. GSM8K-Datensatz zum mathematischen Denken
Geschätzte Größe:4,92 MB
Downloadadresse:https://go.hyper.ai/d9PZh
GSM8K ist ein mathematischer Schlussfolgerungsdatensatz, der 2022 von OpenAI veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers lauten: „Training Verifiers to Solve Math Word Problems“, das darauf abzielt, die Leistung von Modellen des maschinellen Lernens beim Verstehen und Lösen komplexer mathematischer Probleme zu verbessern.
Papieradresse:
https://arxiv.org/abs/2110.14168
Dieser Datensatz enthält 8,5.000 hochwertige Textaufgaben aus dem Grundschulbereich in verschiedenen Sprachen aus den Bereichen Algebra, Arithmetik, Geometrie und anderen Bereichen. Die Lösungsschritte umfassen 2–8 Schritte. Die Lösung besteht hauptsächlich aus einer Reihe einfacher Berechnungen mit grundlegenden Rechenoperationen (+ − × ÷), um das endgültige Ergebnis zu erhalten.
7. VCBench-Benchmark-Datensatz für mathematisches Denken
Geschätzte Größe:86,04 MB
Downloadadresse:https://hyper.ai/cn/datasets/43960
VCBench ist ein Benchmark-Datensatz zur Bewertung multimodalen mathematischen Denkens mit expliziten visuellen Abhängigkeiten, der 2025 von Alibaba und der Zhejiang-Universität veröffentlicht wurde. Der Datensatz enthält 1.720 Frage-Antwort-Paare und insgesamt 6.697 Bilder.
Die Fragen umfassen im Wesentlichen folgende 6 Bereiche:
* Zeit und Kalender: Testet Fragen zum zeitlichen Denken in zwei Unterkategorien (Kalender und Uhr) und erfordert ein Verständnis von Zeitintervallen und kalenderbasierten Berechnungen.
* Raum und Position: Die Herausforderungen konzentrieren sich auf das räumliche Denken in drei Unterkategorien (Richtung, Position und Ort), um das Verständnis der relativen Position, Richtung und räumlichen Beziehungen zu beurteilen.
* Geometrie und Formen: Fragen zu fünf Unterkategorien (Winkel, Vierecke, Rechtecke, Formen und Dreiecke) testen das grundlegende geometrische Verständnis, von der einfachen Formerkennung bis hin zur komplexeren Eigenschaftsanalyse.
* Objekte und Bewegung: Aufgaben in zwei Unterkategorien (Würfel und Bewegung) bewerten das Verständnis von dreidimensionalen Objekten und Bewegungstransformationen.
* Argumentation und Beobachtung: Fragen in beiden Unterkategorien (Schlussfolgerung und Beobachtung) sind darauf ausgelegt, logisches Denken und sorgfältige visuelle Beobachtungsfähigkeiten zu testen.
* Organisation und Muster: Herausforderungen in drei Unterkategorien (Organisation, Muster und Gewichtung) bewerten Mustererkennung, Sequenzierung und Organisationslogik.
Oben finden Sie eine Zusammenfassung der empfohlenen Datensätze in dieser Ausgabe. Laden Sie sie mit einem Klick herunter~