HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 2 mois

Enseigner aux LLMs à planifier : une mise au point par instruction à chaîne de raisonnement logique pour la planification symbolique

Pulkit Verma Ngoc La Anthony Favier Swaroop Mishra Julie A. Shah

Enseigner aux LLMs à planifier : une mise au point par instruction à chaîne de raisonnement logique pour la planification symbolique

Résumé

Les modèles linguistiques massifs (LLM) ont démontré des capacités remarquables sur une grande variété de tâches, mais leur capacité à effectuer une planification symbolique structurée reste limitée, en particulier dans des domaines exigeant des représentations formelles telles que le langage de définition des domaines de planification (PDDL). Dans cet article, nous présentons un nouveau cadre d’instruction tuning, nommé PDDL-Instruct, conçu pour améliorer les capacités de planification symbolique des LLM grâce à une raisonnement en chaîne logique (chain-of-thought). Notre approche se concentre sur l’enseignement aux modèles d’un raisonnement rigoureux concernant l’applicabilité des actions, les transitions d’état et la validité du plan, en utilisant des étapes explicites d’inférence logique. En concevant des prompts d’instruction guidant les modèles à travers les raisonnements logiques précis nécessaires pour déterminer quand une action peut être appliquée dans un état donné, nous permettons aux LLM de corriger eux-mêmes leurs processus de planification grâce à une réflexion structurée. Le cadre développe systématiquement des compétences de vérification en décomposant le processus de planification en chaînes explicites de raisonnement portant sur la satisfaction des préconditions, l’application des effets et la préservation des invariants. Les résultats expérimentaux sur plusieurs domaines de planification montrent que nos modèles ajustés par instruction basés sur le raisonnement en chaîne logique surpassent significativement les modèles de base, atteignant une précision de planification allant jusqu’à 94 % sur des benchmarks standards, soit une amélioration absolue de 66 % par rapport aux modèles de référence. Ce travail comble le fossé entre les capacités générales de raisonnement des LLM et la précision logique requise pour la planification automatisée, ouvrant ainsi une voie prometteuse pour le développement de systèmes d’intelligence artificielle de planification plus performants.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Enseigner aux LLMs à planifier : une mise au point par instruction à chaîne de raisonnement logique pour la planification symbolique | Articles de recherche | HyperAI