SheetCopilot : Porter la Productivité Logicielle au Prochain Niveau grâce aux Grands Modèles Linguistiques

Les utilisateurs finaux des ordinateurs ont consacré des milliards d'heures à l'accomplissement de tâches quotidiennes telles que le traitement de données tabulaires et la planification des chronogrammes de projets. La plupart de ces tâches sont répétitives et sujettes aux erreurs, mais la majorité des utilisateurs finaux ne possèdent pas les compétences nécessaires pour automatiser ces travaux fastidieux. Avec l'émergence des grands modèles linguistiques (LLMs), diriger les logiciels avec des requêtes en langage naturel est devenu un objectif réalisable. Dans cette étude, nous proposons un agent appelé SheetCopilot qui prend en charge les tâches en langage naturel et contrôle les tableurs pour répondre aux exigences. Nous proposons un ensemble d'actions atomiques comme une abstraction des fonctionnalités des logiciels tableurs. Nous concevons également un cadre de planification de tâches basé sur une machine à états pour permettre aux LLMs d'interagir robustement avec les tableurs. Nous avons créé un jeu de données représentatif contenant 221 tâches de contrôle de tableur et établi une chaîne d'évaluation entièrement automatisée pour évaluer rigoureusement la capacité des LLMs dans les tâches de contrôle logiciel. Notre SheetCopilot réussit correctement 44,3 % des tâches lors d'une génération unique, surpassant largement la ligne de base forte en génération de code. Notre page du projet : https://sheetcopilot.github.io/.