HyperAIHyperAI

Command Palette

Search for a command to run...

MACM: Die Nutzung eines Multi-Agenten-Systems zur Bedingungsmining bei der Lösung komplexer mathematischer Probleme

Bin Lei Yi Zhang Shan Zuo Ali Payani Caiwen Ding

Zusammenfassung

Neuere Fortschritte bei großen Sprachmodellen wie GPT-4 haben beachtliche Fähigkeiten im Umgang mit standardisierten Anfragen demonstriert. Trotz dieser Fortschritte sinkt ihre Leistung erheblich bei anspruchsvollen mathematischen Aufgaben, die komplexe, mehrstufige logische Schlussfolgerungen erfordern. Um ihre inferenziellen Fähigkeiten zu verbessern, hat die aktuelle Forschung sich intensiv mit Prompt-Engineering beschäftigt, beispielhaft vertreten durch Ansätze wie den Tree of Thought und den Graph of Thought. Dennoch stoßen diese bestehenden Methoden auf zwei wesentliche Einschränkungen: Erstens ist ihre Wirksamkeit bei der Lösung komplexer mathematischer Probleme begrenzt. Zweitens behindert die Notwendigkeit, für jedes einzelne Problem spezifische Prompts zu entwerfen, ihre Verallgemeinerungsfähigkeit. Um diesen Herausforderungen zu begegnen, führt dieser Artikel die Multi-Agenten-System zur bedingten Exploration (Multi-Agent System for Conditional Mining, MACM) als neuen Prompting-Ansatz ein. MACM ermöglicht nicht nur die Lösung komplexer mathematischer Aufgaben, sondern zeigt zudem starke Verallgemeinerungsfähigkeit über verschiedene mathematische Kontexte hinweg. Mit Unterstützung von MACM steigt die Genauigkeit von GPT-4 Turbo bei den anspruchsvollsten Aufgaben der Schwierigkeitsstufe fünf im MATH-Datensatz von 54,68 % auf 76,73 %. Der Quellcode ist unter \url{https://github.com/bin123apple/MACM} verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp