HyperAIHyperAI

Command Palette

Search for a command to run...

AgentFold : Agents web à horizon long avec gestion proactive du contexte

Résumé

Les agents web fondés sur les LLM montrent un potentiel considérable pour la recherche d'information, mais leur efficacité sur des tâches à horizon long est freinée par un compromis fondamental dans la gestion du contexte. Les agents actuellement dominants, basés sur le cadre ReAct, souffrent d'une saturation du contexte due à l'accumulation de historiques bruts et bruyants, tandis que les méthodes qui résument de manière fixe l'intégralité de l'historique à chaque étape risquent de perdre irrémédiablement des détails cruciaux. Pour remédier à ces limites, nous introduisons AgentFold, un nouveau paradigme d'agent centré sur une gestion proactive du contexte, inspiré du processus cognitif humain de consolidation rétrospective. AgentFold considère son contexte comme un espace cognitif dynamique à sculpter activement, plutôt qu'un journal passif à remplir. À chaque étape, il apprend à exécuter une opération de « pliage » (folding), qui permet de gérer sa trajectoire historique à plusieurs échelles : il peut effectuer des condensations granulaires pour préserver des détails fins et essentiels, ou des consolidations profondes afin d'abstraire des sous-tâches multi-étapes entières. Les résultats obtenus sur des benchmarks réputés sont frappants : avec une simple fine-tuning supervisé (sans pré-entraînement continu ni apprentissage par renforcement), l'agent AgentFold-30B-A3B atteint 36,2 % sur BrowseComp et 47,3 % sur BrowseComp-ZH. Notamment, cette performance dépasse ou égale celle de modèles open source d'une échelle nettement plus grande, tels que DeepSeek-V3.1-671B-A37B, et surpasse même les meilleurs agents propriétaires, comme o4-mini d'OpenAI.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp