SheetAgent : Vers un agent généraliste pour la raisonnement et la manipulation des tableurs grâce aux grands modèles linguistiques

Les tableurs sont omniprésents sur le World Wide Web, jouant un rôle crucial dans l'amélioration de l'efficacité du travail dans divers domaines. Les grands modèles linguistiques (LLM) ont récemment été utilisés pour la manipulation automatique des tableurs, mais leur utilisation n'a pas encore été étudiée dans des tâches complexes et réalistes où des défis de raisonnement existent (par exemple, la manipulation à long terme avec un raisonnement en plusieurs étapes et des exigences ambiguës). Pour combler cet écart par rapport aux exigences du monde réel, nous introduisons SheetRM, une référence comportant des tâches à long terme et multicatégories impliquant une manipulation dépendante du raisonnement due aux défis de la vie réelle. Pour atténuer les défis mentionnés ci-dessus, nous proposons également SheetAgent, un nouvel agent autonome qui utilise le potentiel des LLM. SheetAgent est composé de trois modules collaboratifs : Planificateur, Informateur et Récupérateur, permettant d'atteindre un raisonnement avancé et une manipulation précise des tableurs sans intervention humaine grâce à un processus itératif de raisonnement et de réflexion sur les tâches. Des expériences approfondies montrent que SheetAgent améliore les taux de réussite de 20 à 40 % sur plusieurs références par rapport aux méthodes de base, atteignant une précision accrue dans la manipulation des tableurs et démontrant des capacités supérieures en matière de raisonnement tabulaire. Plus de détails et visualisations sont disponibles sur le site web du projet : https://sheetagent.github.io/. Les jeux de données et le code source sont accessibles à l'adresse suivante : https://anonymous.4open.science/r/SheetAgent.