HyperAI

Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz

Datum

vor 4 Tagen

Organisation

Veröffentlichungs-URL

huggingface.co

Lizenz

Apache 2.0

Download-Hilfe

WebInstruct-verified ist ein Multi-Domain-Reasoning-Datensatz, der 2025 gemeinsam von der University of Waterloo und dem Vector Institute veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers sind „General-Reasoner: Weiterentwicklung des LLM-Denkens in allen Bereichen“, dessen Ziel es ist, die Denkfähigkeit von LLMs in verschiedenen Bereichen zu verbessern und gleichzeitig ihre Stärken in der Mathematik zu erhalten.

Dieser Datensatz enthält rund 230.000 Fragen zum logisch-logischen Denken und deckt eine Vielzahl von Antwortformaten ab, darunter Multiple-Choice-Fragen und Datensätze zu numerischen Ausdrücken, mit einer ausgewogenen Verteilung der Felder. Der Datensatz deckt hauptsächlich Disziplinen wie Mathematik, Physik, Chemie, Finanzen und verschiedene andere Geistes- und Sozialwissenschaften ab.

Datensatzmerkmale:

  • Zero-RL-Training: Direktes Verstärkungslernen vom Basis-LLM unter Umgehung der Zwischenüberwachungsphase.
  • Daten zum vielfältigen Denken: Über 230.000 hochwertige, überprüfbare Fragen aus dem Internet, gefiltert nach der Überprüfbarkeit der Antworten über alle Disziplinen hinweg.
  • Modellbasierter Verifizierer: Ein kompaktes 1,5-B-generatives Verifizierermodell für die kontextbewusste, gedankenkettenbasierte Antwortverifizierung, das herkömmliche regelbasierte Ansätze übertrifft.
Datensatzfeldverteilung