Command Palette
Search for a command to run...
SwissNYF : Agents LLM fondés sur des outils pour les environnements à boîte noire
SwissNYF : Agents LLM fondés sur des outils pour les environnements à boîte noire
Somnath Sendhil Kumar Dhruv Jain Eshaan Agarwal Raunak Pandey
Résumé
Bien que les grands modèles linguistiques (LLM) aient démontré des capacités améliorées en appel de fonctions, ces progrès reposent principalement sur l’accès aux réponses fournies par les fonctions. Cette approche s’avère pratique pour des API simples, mais elle soulève des problèmes de scalabilité face aux API irréversibles, dont l’utilisation a un impact significatif sur le système, comme une API de suppression de base de données. De même, les processus exigeant un temps considérable pour chaque appel d’API, ou ceux nécessitant une planification avancée, tels que les pipelines d’actions automatisées, posent des défis complexes. En outre, des situations surviennent fréquemment où une approche généralisée s’impose, car les algorithmes n’ont pas accès direct aux implémentations spécifiques de ces fonctions ni aux secrets nécessaires à leur utilisation. Les méthodes classiques de planification d’outils s’avèrent insuffisantes dans ces cas, ce qui impose de fonctionner dans des environnements à boîte noire. Contrairement à leur performance en manipulation d’outils, les LLM se distinguent particulièrement dans les tâches à boîte noire, telles que la synthèse de programmes. Nous exploitons donc les capacités de synthèse de programmes des LLM pour concevoir une stratégie d’utilisation d’outils dans des environnements à boîte noire, en garantissant que les solutions soient vérifiées avant leur mise en œuvre. Nous introduisons TOPGUN, une approche ingénieuse fondée sur la synthèse de programmes pour la planification d’outils à boîte noire. Accompagnée de SwissNYF, un ensemble complet intégrant des algorithmes à boîte noire pour les tâches de planification et de vérification, cette méthode répond aux défis susmentionnés et renforce la polyvalence et l’efficacité des LLM dans les interactions complexes avec des API. Le code public de SwissNYF est disponible à l’adresse suivante : https://github.com/iclr-dummy-user/SwissNYF.