HyperAIHyperAI

Command Palette

Search for a command to run...

MapCoder: Multi-Agent-Codegenerierung für wettbewerbsorientiertes Problemlösen

Md. Ashraful Islam Mohammed Eunus Ali Md Rizwan Parvez

Zusammenfassung

Die Code-Synthese, die ein tiefes Verständnis komplexer natürlicher Sprachproblemstellungen erfordert, die Generierung von Code-Anweisungen für komplexe Algorithmen und Datenstrukturen sowie die erfolgreiche Ausführung umfassender Unit-Tests, stellt eine erhebliche Herausforderung dar. Obwohl große Sprachmodelle (LLMs) beeindruckende Fähigkeiten im Bereich der natürlichen Sprachverarbeitung zeigen, bleiben ihre Leistungen bei Aufgaben der Codegenerierung begrenzt. In diesem Paper stellen wir einen neuen Ansatz zur Codegenerierung vor, der Multi-Agent-Prompting nutzt, um einzigartig den gesamten Zyklus der Programm-Synthese nachzuahmen, wie er bei menschlichen Entwicklern beobachtet wird. Unser Framework, MapCoder, besteht aus vier speziell für die Nachahmung der einzelnen Phasen dieses Zyklus konzipierten LLM-Agenten: Rekall relevanter Beispiele, Planung, Codegenerierung und Debugging. Nach umfassenden Experimenten mit mehreren LLM-Ablationen und Analysen an acht anspruchsvollen, wettbewerbsbasierten Benchmark-Aufgaben zur Problemlösung und Programm-Synthese zeigt MapCoder bemerkenswerte Fähigkeiten in der Codegenerierung und erreicht neue State-of-the-Art-Ergebnisse (pass@1) auf HumanEval (93,9 %), MBPP (83,1 %), APPS (22,0 %), CodeContests (28,5 %) und xCodeEval (45,3 %). Darüber hinaus liefert unsere Methode konsistent überlegene Leistungen über verschiedene Programmiersprachen und unterschiedliche Schwierigkeitsgrade der Aufgaben hinweg. Wir stellen unser Framework öffentlich unter https://github.com/Md-Ashraful-Pramanik/MapCoder zur Verfügung.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp