HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 8 jours

ReCode : Unifier planification et action pour un contrôle universel de la granularité

ReCode : Unifier planification et action pour un contrôle universel de la granularité

Résumé

Les tâches du monde réel exigent des décisions à différentes granularités, et les êtres humains s’acquittent brillamment de cette tâche en s’appuyant sur une représentation cognitive unifiée, où la planification est fondamentalement comprise comme une forme de comportement de haut niveau. En revanche, les agents basés sur les grands modèles linguistiques (LLM) actuels manquent de cette capacité essentielle à opérer de manière fluide à travers différentes granularités décisionnelles. Cette limitation provient des paradigmes existants, qui imposent une séparation rigide entre la planification de haut niveau et l’action de bas niveau, ce qui nuit à l’adaptabilité dynamique et limite la généralisation. Nous proposons ReCode (génération récursive de code), un nouveau paradigme qui remédie à cette limitation en unifiant planification et action au sein d’une même représentation sous forme de code. Dans cette représentation, ReCode traite les plans de haut niveau comme des fonctions abstraites de remplacement, que l’agent décompose récursivement en sous-fonctions de plus en plus fines jusqu’à atteindre des actions primitives. Cette approche récursive efface la frontière rigide entre planification et action, permettant à l’agent de contrôler dynamiquement sa granularité décisionnelle. En outre, la structure récursive génère naturellement des données d’entraînement riches et multi-granulaires, permettant aux modèles d’apprendre des processus décisionnels hiérarchiques. Des expérimentations étendues montrent que ReCode surpasse significativement les modèles de référence avancés en termes de performance d’inférence, tout en démontrant une efficacité exceptionnelle en matière d’entraînement, validant ainsi notre hypothèse centrale : l’unification de la planification et de l’action par génération récursive de code constitue une approche puissante et efficace pour atteindre un contrôle universel de la granularité. Le code est disponible à l’adresse suivante : https://github.com/FoundationAgents/ReCode.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
ReCode : Unifier planification et action pour un contrôle universel de la granularité | Articles de recherche | HyperAI