HyperAIHyperAI

Command Palette

Search for a command to run...

vor 13 Tagen

DexFlyWheel: Ein skalierbarer und selbstverbessernder Rahmen zur Datenerzeugung für geschickte Manipulation

DexFlyWheel: Ein skalierbarer und selbstverbessernder Rahmen zur Datenerzeugung für geschickte Manipulation

Abstract

Dexteres Manipulieren ist entscheidend für die Weiterentwicklung roboterischer Fähigkeiten in realen Anwendungen, doch existieren bislang vielfältige und hochwertige Datensätze nur selten. Bestehende Methoden zur Datenerhebung beruhen entweder auf menschlicher Teleoperation oder erfordern erheblichen menschlichen Aufwand bei der Ingenieurarbeit, oder sie generieren Daten mit begrenzter Vielfalt, was ihre Skalierbarkeit und Generalisierbarkeit einschränkt. In diesem Artikel stellen wir DexFlyWheel vor – einen skalierbaren Rahmen zur Datengenerierung, der einen sich selbst verbessern­den Zyklus nutzt, um kontinuierlich die Datenvielfalt zu erhöhen. Ausgehend von einer effizienten Warm-up-Phase mit Seed-Demonstrationen erweitert DexFlyWheel den Datensatz durch iterative Zyklen. Jeder Zyklus folgt einer geschlossenen Schleife, die Imitationslernen (IL), residuelles Verstärkendes Lernen (RL), die Sammlung von Rollout-Trajektorien sowie Datenverstärkung integriert. Insbesondere extrahiert IL menschenähnliches Verhalten aus Demonstrationen, während das residuelle RL die Generalisierung der Policy verbessert. Die gelernte Policy wird anschließend verwendet, um Trajektorien in der Simulation zu generieren, die anschließend über verschiedene Umgebungen und räumliche Konfigurationen hinweg verfeinert werden, bevor sie in den nächsten Zyklus zurückgeführt werden. In aufeinanderfolgenden Iterationen entsteht ein sich selbst verstärkender Datenspinnflügel-Effekt, der Datensätze hervorbringt, die eine breite Vielfalt an Szenarien abdecken und somit die Leistung der Policy skaliert. Experimentelle Ergebnisse zeigen, dass DexFlyWheel über 2.000 vielfältige Demonstrationen für vier anspruchsvolle Aufgaben generiert. Policies, die auf unserem Datensatz trainiert wurden, erreichen eine durchschnittliche Erfolgsquote von 81,9 % auf den Challenge-Testsets und übertragen sich erfolgreich in die reale Welt mittels Digital Twin, wobei eine Erfolgsquote von 78,3 % bei Doppelarm-Hebeaufgaben erzielt wird.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
DexFlyWheel: Ein skalierbarer und selbstverbessernder Rahmen zur Datenerzeugung für geschickte Manipulation | Forschungsarbeiten | HyperAI