HyperAIHyperAI

Command Palette

Search for a command to run...

Inkorporation externen Wissens durch Vortraining für die Generierung von Naturalsprache in Code

Frank F. Xu Zhengbao Jiang Pengcheng Yin Bogdan Vasilescu Graham Neubig

Zusammenfassung

Die generische Codegenerierung zielt darauf ab, Code in einer allgemein verwendbaren Programmiersprache (wie Python) aus natürlichen Sprachabsichten (Natural Language, NL) zu erzeugen. Ausgehend von der Beobachtung, dass Entwickler beim Schreiben von Code häufig Ressourcen im Web recherchieren, untersuchen wir die Wirksamkeit der Integration zweier Arten externer Wissensquellen in die NL-zu-Code-Generierung: automatisch abgeleitete Paare aus natürlicher Sprache und Code aus der Online-Programmier-Frage-Antwort-Plattform StackOverflow sowie Programmiersprach-API-Dokumentationen. Unsere Evaluierungen zeigen, dass die Kombination beider Quellen unter Verwendung von Datenverstärkung (data augmentation) und retrieval-basierter Datensampling-Neujustierung die derzeit beste Leistung um bis zu 2,2 Prozentpunkte im absoluten BLEU-Score auf dem Codegenerierungs-Testfeld CoNaLa übertrifft. Der Quellcode und die zugrundeliegenden Ressourcen sind unter https://github.com/neulab/external-knowledge-codegen verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Inkorporation externen Wissens durch Vortraining für die Generierung von Naturalsprache in Code | Paper | HyperAI