HyperAIHyperAI

Command Palette

Search for a command to run...

Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz

Use this DatasetDiscuss on Discord

Date

vor 5 Monaten

Organization

Universität von Waterloo

Paper URL

arxiv.org

License

Apache 2.0

WebInstruct-verified ist ein Multi-Domain-Reasoning-Datensatz, der 2025 gemeinsam von der University of Waterloo und dem Vector Institute veröffentlicht wurde. Die zugehörigen Ergebnisse des Papiers sind „General-Reasoner: Weiterentwicklung des LLM-Denkens in allen Bereichen“, dessen Ziel es ist, die Denkfähigkeit von LLMs in verschiedenen Bereichen zu verbessern und gleichzeitig ihre Stärken in der Mathematik zu erhalten.

Dieser Datensatz enthält rund 230.000 Fragen zum logisch-logischen Denken und deckt eine Vielzahl von Antwortformaten ab, darunter Multiple-Choice-Fragen und Datensätze zu numerischen Ausdrücken, mit einer ausgewogenen Verteilung der Felder. Der Datensatz deckt hauptsächlich Disziplinen wie Mathematik, Physik, Chemie, Finanzen und verschiedene andere Geistes- und Sozialwissenschaften ab.

Datensatzmerkmale:

  • Zero-RL-Training: Direktes Verstärkungslernen vom Basis-LLM unter Umgehung der Zwischenüberwachungsphase.
  • Daten zum vielfältigen Denken: Über 230.000 hochwertige, überprüfbare Fragen aus dem Internet, gefiltert nach der Überprüfbarkeit der Antworten über alle Disziplinen hinweg.
  • Modellbasierter Verifizierer: Ein kompaktes 1,5-B-generatives Verifizierermodell für die kontextbewusste, gedankenkettenbasierte Antwortverifizierung, das herkömmliche regelbasierte Ansätze übertrifft.
Datensatzfeldverteilung

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Von WebInstruct Verifizierter Multi-Domain-Reasoning-Datensatz | Datasets | HyperAI