vor 5 Monaten

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang

Zusammenfassung

Web-basierte Agenten, die auf großen Sprachmodellen (Large Language Models, LLM) beruhen, zeigen eine starke Leistung bei wissensintensiven Aufgaben. Allerdings sind sie in Paradigmen wie ReAct durch die Beschränkungen des Kontextfensters eingeschränkt. Komplexe Abfragen, die mehrere Entitäten, verflochtene Beziehungen und hohe Unsicherheit beinhalten, erfordern umfangreiche Suchzyklen, die das verfügbare Kontextbudget rasch erschöpfen, bevor eine vollständige Lösung erreicht wird. Um dieser Herausforderung zu begegnen, stellen wir ReSum vor – ein neuartiges Paradigma, das eine unbegrenzte Exploration durch periodische Zusammenfassung des Kontextverlaufs ermöglicht. ReSum wandelt sich stetig erweiternde Interaktionsverläufe in kompakte Schlussfolgerungszustände um und bewahrt so die Aufmerksamkeit gegenüber früheren Entdeckungen, ohne dabei an die Kontextgrenzen gebunden zu sein. Zur Anpassung an dieses Paradigma schlagen wir ReSum-GRPO vor, das GRPO mit segmentierter Trajektorien-Training und Vorteils-Weitergabe kombiniert, um die Agenten mit der auf Zusammenfassungen basierenden Schlussfolgerung vertraut zu machen. Umfangreiche Experimente mit Web-Agenten unterschiedlicher Größenordnung an drei Benchmarks zeigen, dass ReSum gegenüber ReAct im Durchschnitt eine absolute Verbesserung von 4,5 % erzielt, wobei sich nach der ReSum-GRPO-Training noch zusätzliche Verbesserungen von bis zu 8,2 % ergeben. Besonders hervorzuheben ist, dass unser WebResummer-30B (eine ReSum-GRPO-optimierte Version von WebSailor-30B) mit lediglich 1.000 Trainingsbeispielen 33,3 % Pass@1 auf BrowseComp-zh und 18,3 % auf BrowseComp-en erreicht und damit bestehende Open-Source-Web-Agenten übertrifft.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 5 Monaten

Agent

Reasoning

Retrieval-Augmented Generation

Ansatz/Rahmenwerk

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 5 Monaten

Agent

Reasoning

Retrieval-Augmented Generation

Ansatz/Rahmenwerk

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Zusammenfassung: Freigabe von Langzeit-Suchintelligenz durch Kontextzusammenfassung | Paper | HyperAI

Command Palette

Zusammenfassung: Freigabe von Langzeit-Suchintelligenz durch Kontextzusammenfassung

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang4 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Zusammenfassung: Freigabe von Langzeit-Suchintelligenz durch Kontextzusammenfassung

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang4 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Zusammenfassung: Freigabe von Langzeit-Suchintelligenz durch Kontextzusammenfassung

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang4 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang

Xixi Wu Kuan Li Yida Zhao Liwen Zhang Litu Ou Huifeng Yin Zhongwang Zhang Yong Jiang Pengjun Xie Fei Huang