HyperAIHyperAI
il y a 2 mois

CodeXGLUE : Un jeu de données de référence pour l'apprentissage automatique destiné à la compréhension et à la génération de code

Lu, Shuai ; Guo, Daya ; Ren, Shuo ; Huang, Junjie ; Svyatkovskiy, Alexey ; Blanco, Ambrosio ; Clement, Colin ; Drain, Dawn ; Jiang, Daxin ; Tang, Duyu ; Li, Ge ; Zhou, Lidong ; Shou, Linjun ; Zhou, Long ; Tufano, Michele ; Gong, Ming ; Zhou, Ming ; Duan, Nan ; Sundaresan, Neel ; Deng, Shao Kun ; Fu, Shengyu ; Liu, Shujie
CodeXGLUE : Un jeu de données de référence pour l'apprentissage automatique destiné à la compréhension et à la génération de code
Résumé

Les ensembles de données de référence (benchmark datasets) ont un impact significatif sur l'accélération des recherches dans les tâches liées aux langages de programmation. Dans cet article, nous présentons CodeXGLUE, un ensemble de données de référence conçu pour favoriser la recherche en apprentissage automatique (machine learning) pour la compréhension et la génération de programmes. CodeXGLUE comprend une collection de 10 tâches réparties sur 14 ensembles de données ainsi qu'une plateforme d'évaluation et de comparaison des modèles. CodeXGLUE propose également trois systèmes de base, incluant des modèles du style BERT, du style GPT et des modèles Encodeur-Décodeur, afin de faciliter l'utilisation de la plateforme par les chercheurs. La disponibilité de ces données et de ces systèmes de base peut aider au développement et à la validation de nouvelles méthodes applicables à divers problèmes de compréhension et de génération de programmes.

CodeXGLUE : Un jeu de données de référence pour l'apprentissage automatique destiné à la compréhension et à la génération de code | Articles de recherche récents | HyperAI