HyperAIHyperAI

Command Palette

Search for a command to run...

Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz

Datum

vor 3 Monaten

Organisation

Universität von Waterloo

Paper-URL

arxiv.org

Lizenz

Apache 2.0

Treten Sie der Discord-Community bei

WebInstruct-verified ist ein Multi-Domain-Reasoning-Datensatz, der 2025 gemeinsam von der University of Waterloo und dem Vector Institute veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers sind „General-Reasoner: Weiterentwicklung des LLM-Denkens in allen Bereichen“, dessen Ziel es ist, die Denkfähigkeit von LLMs in verschiedenen Bereichen zu verbessern und gleichzeitig ihre Stärken in der Mathematik zu erhalten.

Dieser Datensatz enthält rund 230.000 Fragen zum logisch-logischen Denken und deckt eine Vielzahl von Antwortformaten ab, darunter Multiple-Choice-Fragen und Datensätze zu numerischen Ausdrücken, mit einer ausgewogenen Verteilung der Felder. Der Datensatz deckt hauptsächlich Disziplinen wie Mathematik, Physik, Chemie, Finanzen und verschiedene andere Geistes- und Sozialwissenschaften ab.

Datensatzmerkmale:

  • Zero-RL-Training: Direktes Verstärkungslernen vom Basis-LLM unter Umgehung der Zwischenüberwachungsphase.
  • Daten zum vielfältigen Denken: Über 230.000 hochwertige, überprüfbare Fragen aus dem Internet, gefiltert nach der Überprüfbarkeit der Antworten über alle Disziplinen hinweg.
  • Modellbasierter Verifizierer: Ein kompaktes 1,5-B-generatives Verifizierermodell für die kontextbewusste, gedankenkettenbasierte Antwortverifizierung, das herkömmliche regelbasierte Ansätze übertrifft.
Datensatzfeldverteilung

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz | Datensätze | HyperAI