HyperAIHyperAI

Command Palette

Search for a command to run...

Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz

Datum

vor 6 Monaten

Organisation

Universität von Waterloo

Paper-URL

arxiv.org

Lizenz

Apache 2.0

WebInstruct-verified ist ein Multi-Domain-Reasoning-Datensatz, der 2025 gemeinsam von der University of Waterloo und dem Vector Institute veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers sind „General-Reasoner: Weiterentwicklung des LLM-Denkens in allen Bereichen“, dessen Ziel es ist, die Denkfähigkeit von LLMs in verschiedenen Bereichen zu verbessern und gleichzeitig ihre Stärken in der Mathematik zu erhalten.

Dieser Datensatz enthält rund 230.000 Fragen zum logisch-logischen Denken und deckt eine Vielzahl von Antwortformaten ab, darunter Multiple-Choice-Fragen und Datensätze zu numerischen Ausdrücken, mit einer ausgewogenen Verteilung der Felder. Der Datensatz deckt hauptsächlich Disziplinen wie Mathematik, Physik, Chemie, Finanzen und verschiedene andere Geistes- und Sozialwissenschaften ab.

Datensatzmerkmale:

  • Zero-RL-Training: Direktes Verstärkungslernen vom Basis-LLM unter Umgehung der Zwischenüberwachungsphase.
  • Daten zum vielfältigen Denken: Über 230.000 hochwertige, überprüfbare Fragen aus dem Internet, gefiltert nach der Überprüfbarkeit der Antworten über alle Disziplinen hinweg.
  • Modellbasierter Verifizierer: Ein kompaktes 1,5-B-generatives Verifizierermodell für die kontextbewusste, gedankenkettenbasierte Antwortverifizierung, das herkömmliche regelbasierte Ansätze übertrifft.
Datensatzfeldverteilung

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp