Command Palette
Search for a command to run...
WebResearcher: Freisetzen einer grenzenlosen Schlussfolgerungsfähigkeit bei Long-Horizon-Agenten
WebResearcher: Freisetzen einer grenzenlosen Schlussfolgerungsfähigkeit bei Long-Horizon-Agenten
Zusammenfassung
Neuere Fortschritte in Deep-Research-Systemen haben das Potenzial von KI-Agenten demonstriert, Wissen autonom aus externen Quellen zu entdecken und zu synthetisieren. In diesem Paper stellen wir WebResearcher vor, einen neuartigen Framework zur Entwicklung solcher Agenten, der sich aus zwei zentralen Komponenten zusammensetzt: (1) WebResearcher, einem iterativen Deep-Research-Paradigma, das die tiefgehende Forschung als Markov-Entscheidungsprozess reformuliert, bei dem Agenten ihre Erkenntnisse periodisch in sich weiterentwickelnde Berichte zusammenfassen und dabei fokussierte Arbeitsumgebungen beibehalten, wodurch die durch bestehende mono-kontextuelle Ansätze verursachten Probleme der Kontextüberlastung und Rauschkontamination überwunden werden; und (2) WebFrontier, einem skalierbaren Datensynthesemotor, der hochwertige Trainingsdaten durch tool-erweiterte Komplexitätssteigerung generiert und somit die systematische Erzeugung von Forschungsaufgaben ermöglicht, die die Lücke zwischen passivem Wissensabruf und aktiver Wissenskonstruktion schließt. Besonders hervorzuheben ist, dass die aus unserem Paradigma stammenden Trainingsdaten die Werkzeugnutzungsfähigkeiten selbst traditioneller mono-kontextueller Methoden erheblich verbessern. Darüber hinaus skaliert unser Paradigma natürlich durch paralleles Denken, was eine gleichzeitige Mehrfach-Agenten-Exploration für umfassendere Schlussfolgerungen ermöglicht. Umfangreiche Experimente an sechs anspruchsvollen Benchmarks zeigen, dass WebResearcher eine state-of-the-art-Leistung erzielt – sogar die führenden proprietären Systeme übertreffend.