HyperAIHyperAI
il y a 13 jours

NL2CMD : Un workflow mis à jour pour la traduction de langage naturel en commandes Bash

Quchen Fu, Zhongwei Teng, Marco Georgaklis, Jules White, Douglas C. Schmidt
NL2CMD : Un workflow mis à jour pour la traduction de langage naturel en commandes Bash
Résumé

La traduction du langage naturel en commandes Bash est un domaine de recherche émergent qui a suscité un intérêt croissant ces dernières années. La plupart des travaux se sont concentrés sur la création de modèles de traduction plus précis. À notre connaissance, seules deux bases de données sont actuellement disponibles, l’une étant fondée sur l’autre. Ces deux ensembles de données reposent toutes deux sur le scraping de sources de données connues (via des plateformes telles que Stack Overflow, le crowdsourcing, etc.) et sur le recours à des experts pour valider et corriger soit le texte en anglais, soit les commandes Bash. Ce papier apporte deux contributions majeures à la recherche sur la synthèse de commandes Bash à partir de zéro. Premièrement, nous décrivons un modèle de traduction de pointe capable de générer des commandes Bash à partir de textes en anglais correspondants. Deuxièmement, nous introduisons une nouvelle base de données NL2CMD, entièrement générée automatiquement, nécessitant une intervention humaine minimale et dont la taille dépasse six fois celle des bases de données précédentes. Étant donné que le pipeline de génération ne repose pas sur des commandes Bash existantes, la distribution et les types de commandes peuvent être ajustés selon des besoins spécifiques. Nous évaluons les performances de ChatGPT sur cette tâche et discutons du potentiel d’utilisation de ce modèle comme générateur de données. Nos résultats empiriques montrent comment l’échelle et la diversité de notre base de données offrent des opportunités uniques aux chercheurs en interprétation sémantique.

NL2CMD : Un workflow mis à jour pour la traduction de langage naturel en commandes Bash | Articles de recherche récents | HyperAI