Command Palette
Search for a command to run...
OpenHA: Eine Reihe von Open-Source-hierarchischen agierenden Modellen in Minecraft
Zihao Wang Muyao Li Kaichen He Xiangyu Wang Zhancun Mu Anji Liu Yitao Liang

Abstract
Die Auswahl der Aktionsräume stellt eine entscheidende, bislang jedoch ungelöste Herausforderung bei der Entwicklung leistungsfähiger, end-to-end trainierbarer Agenten dar. In diesem Artikel präsentieren wir zunächst einen umfassenden, großskaligen Vergleich prominenter abstrahierter Aktionsräume und Tokenizer für Vision-Language-Action (VLA)-Modelle oder hierarchische Agenten in der offenen Umgebung Minecraft. Unsere Analyse zeigt, dass kein einzelner Aktionsraum universell optimal ist; vielmehr ist die effektivste Abstraktion stark aufgabeabhängig, was ein Dilemma bei der Entwicklung generalistischer Agenten darstellt. Um dieses Problem zu lösen, führen wir Chain of Action (CoA) ein – einen neuartigen Rahmen, der hochgradige Planung und niedrigstufige Steuerung innerhalb eines einzigen, monolithischen VLA-Modells vereint. CoA betrachtet eine abstrahierte Aktion nicht als Befehl für eine getrennte Policy, sondern als Zwischenschritt der Überlegung – vergleichbar einer Gedankenkette –, der die Generierung der endgültigen, ausführbaren Aktion leitet. Darüber hinaus zeigen wir, dass ein All-in-One-Agent, der auf einer vielfältigen Mischung aus Aktionsräumen im Rahmen des CoA-Paradigmas trainiert wurde, eine robuster und generalisierbarere Policy erlernt. Dieser vereinheitlichte Agent erreicht eine neue State-of-the-Art-Leistung und übertrifft die Gesamterfolgsquote gegenüber starken, spezialisierten Baselines. Um reproduzierbare Forschung zu fördern, veröffentlichen wir die OpenHA-(Open Hierarchical Agents)-Suite, die unser umfassendes Benchmarking mit über 800 unterschiedlichen Aufgaben, konsultierte Datensätze, den Quellcode sowie alle vortrainierten Modell-Checkpoint-Dateien unter folgender URL bereitstellt: https://url
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.