Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor einem Jahr

Organisation

Paper-URL

arxiv.org

Lizenz

Apache 2.0

Datensatzmerkmale:

Zero-RL-Training: Direktes Verstärkungslernen vom Basis-LLM unter Umgehung der Zwischenüberwachungsphase.
Daten zum vielfältigen Denken: Über 230.000 hochwertige, überprüfbare Fragen aus dem Internet, gefiltert nach der Überprüfbarkeit der Antworten über alle Disziplinen hinweg.
Modellbasierter Verifizierer: Ein kompaktes 1,5-B-generatives Verifizierermodell für die kontextbewusste, gedankenkettenbasierte Antwortverifizierung, das herkömmliche regelbasierte Ansätze übertrifft.
Datensatzfeldverteilung

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor einem Jahr

Organisation

Paper-URL

arxiv.org

Lizenz

Apache 2.0

Datensatzmerkmale:

Zero-RL-Training: Direktes Verstärkungslernen vom Basis-LLM unter Umgehung der Zwischenüberwachungsphase.
Daten zum vielfältigen Denken: Über 230.000 hochwertige, überprüfbare Fragen aus dem Internet, gefiltert nach der Überprüfbarkeit der Antworten über alle Disziplinen hinweg.
Modellbasierter Verifizierer: Ein kompaktes 1,5-B-generatives Verifizierermodell für die kontextbewusste, gedankenkettenbasierte Antwortverifizierung, das herkömmliche regelbasierte Ansätze übertrifft.
Datensatzfeldverteilung

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

vor 2 Monaten

Groundsource Global Flood Events Dataset

vor 3 Monaten

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

vor 4 Monaten

Open-RL Inferenzproblem-Datensatz

vor 4 Monaten

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 2 Monaten

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

vor 5 Monaten

MCIF Multimodal Cross-Language Instruction Following Dataset

vor 6 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz

Datensatzmerkmale:

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz

Datensatzmerkmale:

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Open-RL Inferenzproblem-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz

Datensatzmerkmale:

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Open-RL Inferenzproblem-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Open-RL Inferenzproblem-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset

Zugehörige Datensätze

ToolACE-Datensatz Für Lerndialoge Mit Komplexen Werkzeugen

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

Open-RL Inferenzproblem-Datensatz

RoVid-X-Roboter-Videogenerierungsdatensatz

Nemotron-Math-v2 Datensatz Für Mathematische Inferenz

MCIF Multimodal Cross-Language Instruction Following Dataset

TxT360-3efforts Multi-Task Inference Dataset