Command Palette
Search for a command to run...
AgentFold : Agents web à horizon long avec gestion proactive du contexte
AgentFold : Agents web à horizon long avec gestion proactive du contexte
Résumé
Les agents web fondés sur les LLM montrent un potentiel considérable pour la recherche d'information, mais leur efficacité sur des tâches à horizon long est freinée par un compromis fondamental dans la gestion du contexte. Les agents actuellement dominants, basés sur le cadre ReAct, souffrent d'une saturation du contexte due à l'accumulation de historiques bruts et bruyants, tandis que les méthodes qui résument de manière fixe l'intégralité de l'historique à chaque étape risquent de perdre irrémédiablement des détails cruciaux. Pour remédier à ces limites, nous introduisons AgentFold, un nouveau paradigme d'agent centré sur une gestion proactive du contexte, inspiré du processus cognitif humain de consolidation rétrospective. AgentFold considère son contexte comme un espace cognitif dynamique à sculpter activement, plutôt qu'un journal passif à remplir. À chaque étape, il apprend à exécuter une opération de « pliage » (folding), qui permet de gérer sa trajectoire historique à plusieurs échelles : il peut effectuer des condensations granulaires pour préserver des détails fins et essentiels, ou des consolidations profondes afin d'abstraire des sous-tâches multi-étapes entières. Les résultats obtenus sur des benchmarks réputés sont frappants : avec une simple fine-tuning supervisé (sans pré-entraînement continu ni apprentissage par renforcement), l'agent AgentFold-30B-A3B atteint 36,2 % sur BrowseComp et 47,3 % sur BrowseComp-ZH. Notamment, cette performance dépasse ou égale celle de modèles open source d'une échelle nettement plus grande, tels que DeepSeek-V3.1-671B-A37B, et surpasse même les meilleurs agents propriétaires, comme o4-mini d'OpenAI.