Datum

vor einem Jahr

Organisation

Paper-URL

Tags

AceReason-1.1-SFT ist ein vielfältiger und hochwertiger Supervised Fine-Tuning-Datensatz (SFT), der 2025 von NVIDIA veröffentlicht wurde und sich auf mathematisches Denken und Code-Reasoning konzentriert. Die zugehörigen Ergebnisse sind:AceReason-Nemotron 1.1: Fortschrittliche Mathematik und Code-Reasoning durch SFT- und RL-Synergie“, dessen Ziel es ist, SFT-Modelle zu trainieren, die sich auf mathematisches Denken und Code-Argumentation konzentrieren. Dieser Datensatz dient als mathematisches und Code-Argumentationsmodell AceReason-Nemotron-1.1-7B SFT-Trainingsdaten von , alle Antworten im Datensatz werden von DeepSeek-R1 generiert. Der AceReason-1.1-SFT-Datensatz enthält 2.668.741 mathematische Beispiele und 1.301.591 Codebeispiele und deckt Daten von OpenMathReasoning, NuminaMath-CoT, OpenCodeReasoning, MagicoderEvolInstruct, opc-sft-stage2, Leetcode, TACO und Apps ab. Der Datensatz wurde bereinigt und Beispiele mit 9-Gramm-Überlappung mit Testbeispielen in Mathematik- und Code-Benchmarks werden herausgefiltert.

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

Datum

vor einem Jahr

Organisation

Paper-URL

arxiv.org

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

Diabetes Mexiko (Mexiko-Diabetes-Datensatz)

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

AceReason-1.1-SFT-Datensatz Zum Mathematischen Code-Argumentieren

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

Diabetes Mexiko (Mexiko-Diabetes-Datensatz)

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

Diabetes Mexiko (Mexiko-Diabetes-Datensatz)

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Zugehörige Datensätze

CHOCLO Lateinamerikanischer Kultur-Benchmark-Datensatz

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

zh-meme-sft-8k Chinesischer Internet-Meme-Kultur-Datensatz

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

THINGS-MEG-Magnetoenzephalographie-Datensatz

THINGS-fMRI-Datensatz Für Funktionelle Magnetresonanztomographie

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

Diabetes Mexiko (Mexiko-Diabetes-Datensatz)

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset