Recherche profonde avec diffusion en temps de test

Les agents de recherche approfondie, alimentés par des modèles de langage à grande échelle (LLM), progressent rapidement ; toutefois, leurs performances tendent souvent à stagner lors de la génération de rapports de recherche complexes et longs, en utilisant des algorithmes de scaling à l'inférence générale. Inspirés par la nature itérative de la recherche humaine, qui implique des cycles de recherche, de raisonnement et de révision, nous proposons le Test-Time Diffusion Deep Researcher (TTD-DR). Ce cadre novateur conçoit la génération de rapports de recherche comme un processus de diffusion. Le TTD-DR démarre ce processus à partir d'un brouillon initial, un squelette modifiable qui sert de base évolutive pour guider la direction de la recherche. Ce brouillon est ensuite raffiné itérativement via un processus de « débruitage », qui est dynamiquement alimenté par un mécanisme de recherche intégrant des informations externes à chaque étape. Le processus central est renforcé par un algorithme d'auto-évolution appliqué à chaque composant du workflow agencé, assurant ainsi la génération d'un contexte de haute qualité pour le processus de diffusion. Ce design centré sur le brouillon rend le processus d'écriture des rapports plus ponctuel et cohérent, tout en réduisant la perte d'information lors du processus de recherche itératif. Nous démontrons que notre TTD-DR obtient des résultats de pointe sur une large gamme de benchmarks nécessitant une recherche intensive et un raisonnement à plusieurs étapes, dépassant significativement les agents de recherche approfondie existants.