HyperAIHyperAI

Command Palette

Search for a command to run...

vor 8 Tagen

ReCode: Plan und Aktion für eine universelle Steuerung der Granularität vereinheitlichen

ReCode: Plan und Aktion für eine universelle Steuerung der Granularität vereinheitlichen

Abstract

Realweltliche Aufgaben erfordern Entscheidungen auf unterschiedlichen Granularitätsstufen, wobei Menschen sich durch die Nutzung einer einheitlichen kognitiven Repräsentation hierbei besonders gut auszeichnen, bei der Planung grundsätzlich als eine hochlevelige Form von Handlung verstanden wird. Derzeitige auf großen Sprachmodellen (Large Language Models, LLM) basierende Agenten verfügen jedoch über diese entscheidende Fähigkeit nicht, fluid über verschiedene Entscheidungsgranularitäten hinweg zu operieren. Dieser Mangel beruht auf bestehenden Paradigmen, die eine starre Trennung zwischen hochleveligem Planen und niedrigleveligem Handeln vorsehen, was die dynamische Anpassungsfähigkeit beeinträchtigt und die Generalisierbarkeit einschränkt. Wir stellen ReCode (Recursive Code Generation) vor, ein neuartiges Paradigma, das diese Limitation überwindet, indem Planung und Handlung innerhalb einer einzigen Code-Repräsentation vereint werden. In dieser Repräsentation werden hochlevelige Pläne als abstrakte Platzhalterfunktionen behandelt, die der Agent rekursiv in feinkörnigere Unterfunktionen zerlegt, bis schließlich primitive Aktionen erreicht werden. Dieser rekursive Ansatz beseitigt die starre Trennlinie zwischen Planung und Handlung und ermöglicht es dem Agenten, die Granularität seiner Entscheidungen dynamisch zu steuern. Zudem generiert die rekursive Struktur inhärent reichhaltige, mehrschichtige Trainingsdaten, die es Modellen ermöglichen, hierarchische Entscheidungsprozesse zu lernen. Ausführliche Experimente zeigen, dass ReCode erheblich gegenüber fortschrittlichen Baselines in der Inferenzleistung abschneidet und sich bei der Trainingsphase durch außergewöhnliche Dateneffizienz auszeichnet. Damit wird unsere zentrale Erkenntnis bestätigt, dass die Vereinigung von Planung und Handlung durch rekursive Codegenerierung ein leistungsfähiger und effektiver Ansatz für die Erreichung universeller Granularitätssteuerung ist. Der Quellcode ist unter https://github.com/FoundationAgents/ReCode verfügbar.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
ReCode: Plan und Aktion für eine universelle Steuerung der Granularität vereinheitlichen | Forschungsarbeiten | HyperAI