HyperAIHyperAI
il y a 11 jours

TFix : Apprendre à corriger les erreurs de codage avec un Transformer texte-à-texte

{Martin Vechev, Veselin Raychev, Jingxuan He, Berkay Berabi}
TFix : Apprendre à corriger les erreurs de codage avec un Transformer texte-à-texte
Résumé

Le problème de la correction des erreurs dans les programmes a suscité un intérêt considérable au fil des ans. Le défi majeur consiste à concevoir un outil de correction de code efficace capable de capturer une large variété d'erreurs tout en maintenant une précision élevée. Dans cet article, nous abordons ce défi et présentons un nouveau système fondé sur l'apprentissage automatique, nommé TFix. TFix opère directement sur le texte du programme et reformule le problème de la correction de code comme une tâche de transformation de texte en texte. Cette approche permet de tirer parti d’un modèle puissant basé sur les Transformers, pré-entraîné sur des données linguistiques naturelles et affiné pour générer des corrections de code (à partir d’un ensemble de données massif et de haute qualité extrait des validations GitHub). TFix n’est pas spécifique à un langage de programmation particulier ni à une catégorie d’anomalies ; au contraire, il améliore sa précision en étant affiné simultanément sur 52 types d’erreurs différents signalés par un analyseur statique populaire. Évalué sur un jeu de données massif de programmes JavaScript, TFix s’avère pratiquement efficace : il parvient à générer un code corrigé dans 67 % des cas, et surpasse significativement les approches existantes fondées sur l’apprentissage automatique.

TFix : Apprendre à corriger les erreurs de codage avec un Transformer texte-à-texte | Articles de recherche récents | HyperAI