il y a 6 mois

Résumé

La synthèse de programmes ou la génération de code vise à produire un programme satisfaisant une spécification de problème donnée. Les approches récentes basées sur des modèles linguistiques pré-entraînés à grande échelle (LM) ont montré des résultats prometteurs, mais elles présentent toutefois des limitations critiques. En particulier, elles suivent généralement une procédure classique d’ajustement fin supervisé, entraînant un modèle de génération de code uniquement à partir de paires de descriptions en langage naturel et de programmes corrects (ground-truth). Ce paradigme ignore largement des signaux importants mais potentiellement utiles présents dans la spécification du problème, tels que les tests unitaires, ce qui entraîne souvent des performances médiocres lors de la résolution de tâches de codage complexes inconnues auparavant. Pour surmonter ces limites, nous proposons « CodeRL », un nouveau cadre pour les tâches de synthèse de programmes, combinant des modèles linguistiques pré-entraînés et l’apprentissage par renforcement profond (RL). Plus précisément, pendant l’entraînement, nous considérons le modèle LM de génération de code comme un réseau acteur, et introduisons un réseau critique entraîné pour prédire la correction fonctionnelle des programmes générés, fournissant ainsi des signaux de rétroaction densifiés à l’acteur. Pendant l’inférence, nous introduisons une nouvelle procédure de génération reposant sur une stratégie d’échantillonnage cruciale, permettant au modèle de régénérer automatiquement des programmes en se basant sur les retours des tests unitaires d'exemple et sur les scores fournis par le réseau critique. Concernant les architectures de base du modèle, nous avons étendu l’architecture encodeur-décodage de CodeT5 en intégrant des objectifs d’apprentissage améliorés, des tailles de modèle plus importantes et des données d’entraînement préalable de meilleure qualité. Notre méthode atteint non seulement de nouveaux résultats SOTA sur le défi APPS, mais démontre également une forte capacité de transfert zéro-shot, obtenant de nouveaux résultats SOTA sur le benchmark plus simple MBPP.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Traitement Du Langage Naturel

Tâche

Hung Le Yue Wang Akhilesh Deepak Gotmare Silvio Savarese Steven C.H. Hoi

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 6 mois

Traitement Du Langage Naturel

Tâche

Hung Le Yue Wang Akhilesh Deepak Gotmare Silvio Savarese Steven C.H. Hoi

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

CodeRL : Maîtriser la génération de code grâce aux modèles pré-entraînés et l'apprentissage par renforcement profond

Hung Le Yue Wang Akhilesh Deepak Gotmare Silvio Savarese Steven C.H. Hoi

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

CodeRL : Maîtriser la génération de code grâce aux modèles pré-entraînés et l'apprentissage par renforcement profond

Hung Le Yue Wang Akhilesh Deepak Gotmare Silvio Savarese Steven C.H. Hoi

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

CodeRL : Maîtriser la génération de code grâce aux modèles pré-entraînés et l'apprentissage par renforcement profond

Hung Le Yue Wang Akhilesh Deepak Gotmare Silvio Savarese Steven C.H. Hoi

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters