TaskCraft : Génération Automatisée de Tâches Agentiques

Les tâches agencées, qui nécessitent une résolution de problèmes en plusieurs étapes avec autonomie, utilisation d'outils et raisonnement adaptatif, deviennent de plus en plus centrales pour l'avancement du traitement du langage naturel (NLP) et de l'intelligence artificielle (IA). Cependant, les données d'instruction existantes manquent d'interactions avec des outils, et les benchmarks actuels agencés reposent sur des annotations humaines coûteuses, limitant ainsi leur capacité à être mise à l'échelle. Nous présentons \textsc{TaskCraft}, un flux de travail automatisé permettant de générer des tâches agencées difficiles à ajuster, utilisant plusieurs outils et vérifiables, avec des trajectoires d'exécution. TaskCraft élargit les tâches atomiques en utilisant des extensions basées sur la profondeur et la largeur pour créer des défis structuralement et hiérarchiquement complexes. Les résultats empiriques montrent que ces tâches améliorent l'optimisation des prompts dans le flux de génération et renforcent l'ajustement supervisé des modèles fondamentaux agencés. Nous proposons un grand ensemble de données synthétiques comprenant environ 36 000 tâches de difficulté variable pour soutenir les futures recherches sur l'ajustement et l'évaluation des agents.