HyperAIHyperAI
il y a 13 jours

GAP-Gen : Génération automatique guidée de code Python

Junchen Zhao, Yurun Song, Junlin Wang, Ian G. Harris
GAP-Gen : Génération automatique guidée de code Python
Résumé

La génération automatique de code à partir de descriptions en langage naturel peut offrir des avantages significatifs au cours du processus de développement logiciel. Dans ce travail, nous proposons GAP-Gen, une méthode de génération automatique de code Python guidée fondée sur des contraintes syntaxiques et sémantiques propres au langage Python. Nous introduisons tout d’abord des contraintes syntaxiques Python sous la forme de Syntax-Flow, une version simplifiée de l’Arbre Syntaxique Abstrait (AST) qui réduit la taille et la complexité élevée de l’AST tout en préservant les informations syntaxiques essentielles du code Python. En complément de Syntax-Flow, nous introduisons Variable-Flow, une représentation qui abstrait de manière cohérente les noms de variables et de fonctions tout au long du code. Contrairement aux approches reposant sur un pré-entraînement, notre méthode se concentre sur l’optimisation du processus de fine-tuning, ce qui permet de réduire les besoins en ressources computationnelles tout en maintenant des performances élevées sur la tâche de génération automatique de code Python. GAP-Gen met en œuvre le fine-tuning des modèles linguistiques basés sur les transformateurs T5 et CodeT5 à l’aide des jeux de données Code-to-Docstring CodeSearchNet, CodeSearchNet AdvTest et Code-Docstring Corpus provenant d’EdinburghNLP. Nos expérimentations montrent que GAP-Gen obtient des résultats supérieurs à ceux des méthodes antérieures sur la tâche de génération automatique de code Python.

GAP-Gen : Génération automatique guidée de code Python | Articles de recherche récents | HyperAI