vor 8 Stunden

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen

Zusammenfassung

Große Sprachmodelle (Large Language Models, LLM) haben bei komplexen Aufgaben beeindruckende Ergebnisse erzielt, operieren jedoch häufig isoliert und lernen selten aus vergangenen Erfahrungen. Bestehende methodenbasierte Ansätze zur Speicherung von Erfahrungen speichern überwiegend rohe Zustandsverläufe, die oft redundant und geräuschbehaftet sind. Dies erschwert die Extraktion hochwertiger, wiederverwendbarer Verhaltensmuster, die für eine generalisierbare Leistung entscheidend sind. In diesem Artikel stellen wir SkillRL vor, einen Rahmen, der die Lücke zwischen rohen Erfahrungen und der Verbesserung der Politik durch automatisierte Fähigkeitsentdeckung und rekursive Evolution schließt. Unser Ansatz führt eine auf Erfahrungen basierende Verdichtungsmechanik ein, um eine hierarchische Fähigkeitsbibliothek namens SkillBank aufzubauen, eine adaptive Abrufstrategie für allgemeine und aufgabenbezogene Heuristiken sowie einen rekursiven Evolutionsmechanismus, der es ermöglicht, dass die Fähigkeitsbibliothek gemeinsam mit der Politik des Agents während des Verstärkungslernens evolviert. Diese Innovationen reduzieren den Token-Verbrauch erheblich und verbessern gleichzeitig die Relevanz der Schlussfolgerungsfähigkeit. Experimentelle Ergebnisse auf ALFWorld, WebShop und sieben suchunterstützten Aufgaben zeigen, dass SkillRL eine state-of-the-art-Leistung erzielt und starke Baselines um durchschnittlich über 15,3 % übertrifft, während die Robustheit bei steigender Aufgabenkomplexität erhalten bleibt. Der Quellcode ist unter diesem Link verfügbar: https://…

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Stunden

Verstärkendes Lernen

Agent

Retrieval-Augmented Generation

Ansatz/Rahmenwerk

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Stunden

Verstärkendes Lernen

Agent

Retrieval-Augmented Generation

Ansatz/Rahmenwerk

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

SkillRL: Evolutionäre Agenten durch rekursiv skillbasierte Verstärkungslernverfahren

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen3 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

SkillRL: Evolutionäre Agenten durch rekursiv skillbasierte Verstärkungslernverfahren

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen3 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

SkillRL: Evolutionäre Agenten durch rekursiv skillbasierte Verstärkungslernverfahren

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen3 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen

Peng Xia Jianwen Chen Hanyang Wang Jiaqi Liu Kaide Zeng Yu Wang Siwei Han Yiyang Zhou Xujiang Zhao Haifeng Chen