HyperAI
Back to Headlines

AI verbessert Mathelösungen durch Sprache und Werkzeuge.

vor 8 Tagen

Forscher der Carnegie Mellon University haben ein neues Framework namens DualDistill entwickelt, das die Stärken von natürlicher Sprachverarbeitung und Tool-gestütztem Denken kombiniert, um die mathematische Problemlösung von KI-Modellen zu verbessern. Bisherige Modelle, die langfristige KI-Verifikation (long-CoT) verwenden, sind zwar leistungsstark, aber oft rechenintensiv und anfällig für Fehler, da sie sich auf reine Sprachverarbeitung verlassen. Tool-gebundene Ansätze, wie beispielsweise OpenHands, ermöglichen effizientere Berechnungen, haben jedoch Schwierigkeiten mit abstrakten oder komplexen Problemen. DualDistill nutzt zwei unterschiedliche Lehrermodelle: einen, der auf natürlicher Sprachverarbeitung basiert (DeepSeek-R1), und einen, der mit Tools arbeitet (OpenHands). Das Student-Modell Agentic-R1 lernt dynamisch, die beste Strategie für jedes Problem auszuwählen. Während es Code-Interpreten für arithmetische und algorithmische Aufgaben verwendet, setzt es natürliche Sprache für abstrakte Probleme ein. Durch Trajektorien-Komposition und Selbst-Distillation wird das Wissen beider Lehrer in das Agentic-R1-Modell integriert. In Tests auf Benchmarks wie DeepMath-L und Combinatorics300 zeigte Agentic-R1 deutliche Verbesserungen gegenüber Modellen, die entweder ausschließlich auf Tools oder auf reine Sprachverarbeitung setzen. Es erreichte höhere Genauigkeit und Effizienz, selbst wenn die Lehrermodelle nicht perfekt waren. Zum Beispiel verbesserte sich die Genauigkeit des Student-Modells von 44,7 % auf 50,9 %, obwohl der agente-basierte Lehrer nur 48,4 % erreichte. Qualitative Analysen zeigten, dass Agentic-R1 die Tools in 79,2 % der komplexen Combinatorics300-Probleme aktiviert, während es bei einfacheren AMC-Datensätzen nur in 52 % der Fälle Tools nutzt. Das Modell lernt, Tools effektiv einzusetzen, ohne explizite Anweisungen, was eine bessere Balance zwischen Rechenleistung und Genauigkeit ermöglicht. DualDistill zeigt, dass es möglich ist, KI-Modelle zu trainieren, die flexibel zwischen verschiedenen Problemlösungsstrategien wechseln können, um in unterschiedlichen Szenarien optimal zu funktionieren. Das Modell könnte in Zukunft bei der Entwicklung von intelligenten KI-Agenten von Bedeutung sein, die komplexe Probleme effizienter lösen können. Die Forschung wird auf arXiv veröffentlicht und auf GitHub zugänglich gemacht. Die Entwickler betonen, dass das Modell eine vielversprechende Richtung für zukünftige KI-Systeme darstellt, die unterschiedliche Strategien kombinieren können, um robustere und effizientere Entscheidungen zu treffen. Experten aus der Industrie erwarten, dass solche Ansätze die Anwendung von KI in Bereichen wie Finanzen, Forschung und Softwareentwicklung weiter voranbringen könnten.

Related Links