HyperAI

Stellen Sie OpenMath-Nemotron-1.5B Mit vLLM+Open WebUI Bereit

1. Einführung in das Tutorial

Die in diesem Tutorial verwendeten Rechenressourcen sind eine einzelne RTX 4090-Karte. Dieses Modell unterstützt nur Fragen zur Computermathematik und die Antworten sind auf Englisch.

OpenMath-Nemotron-1.5B wurde am 23. April 2025 vom NVIDIA-Team NemoSkils veröffentlicht. Das Modell wurde durch Feinabstimmung von Qwen/Qwen2.5-Math-1.5B auf dem OpenMathReasoning-Datensatz erstellt. Das Modell erzielt bei gängigen mathematischen Benchmarks modernste Ergebnisse und wurde für die kommerzielle Nutzung lizenziert. Die relevanten Papierergebnisse sindAIMO-2-Gewinnerlösung: Erstellen hochmoderner mathematischer Argumentationsmodelle mit dem OpenMathReasoning-Datensatz".

2. Projektbeispiele

3. Bedienungsschritte

1. Starten Sie den Container

Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 2–3 Minuten und aktualisieren Sie die Seite.

2. Nachdem Sie die Webseite aufgerufen haben, können Sie ein Gespräch mit dem Modell beginnen

4. Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

Zitationsinformationen

Dank an den Github-Benutzer SuperYang  Bereitstellung dieses Tutorials. Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@article{moshkov2025aimo2,
  title   = {AIMO-2 Winning Solution: Building State-of-the-Art Mathematical Reasoning Models with OpenMathReasoning dataset},
  author  = {Ivan Moshkov and Darragh Hanley and Ivan Sorokin and Shubham Toshniwal and Christof Henkel and Benedikt Schifferer and Wei Du and Igor Gitman},
  year    = {2025},
  journal = {arXiv preprint arXiv:2504.16891}
}