HyperAIHyperAI

Command Palette

Search for a command to run...

DexFlyWheel-Datengenerierungsframework

Datum

vor 10 Tagen

Organisation

Paper-URL

2509.23829

DexFlyWheel wurde im September 2025 von der Peking-Universität, dem Harbin Institute of Technology und PsiBot vorgeschlagen, und die entsprechenden Forschungsergebnisse wurden in der Arbeit „DexFlyWheel: Ein skalierbares und selbstlernendes Framework zur Datengenerierung für die geschickte Manipulation", wurde von NeurIPS 2025 als Spotlight-Projekt angenommen.

DexFlyWheel ist ein skalierbares Framework zur Datengenerierung, das mithilfe einer selbstoptimierenden Schleife die Datenvielfalt kontinuierlich erweitert. Das Framework zeichnet sich durch zwei zentrale Designmerkmale aus: Introducing Learning (IL) und Residual Reinforcement Learning (RL) zur Generierung menschenähnlicher und vielfältiger Daten. IL und Residual RL bilden in Kombination mit Policy Unrolling und Datenerweiterung eine selbstoptimierende Schleife. In jeder Iteration generiert die Policy Trajektorien, die anschließend in zunehmend vielfältigen Szenarien optimiert und in die nächste Iteration eingespeist werden. Diese Schleife erzeugt einen Schwungradeffekt, der die Datenvielfalt schrittweise erweitert, die Generalisierungsfähigkeit der Policy verbessert und sich zu einem robusten, generalisierbaren Datengenerierungsagenten entwickelt.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp