HyperAIHyperAI

Command Palette

Search for a command to run...

DexFlyWheel-Datengenerierungsframework

Date

vor 2 Monaten

Organization

Paper URL

2509.23829

DexFlyWheel wurde im September 2025 von der Peking-Universität, dem Harbin Institute of Technology und PsiBot vorgeschlagen, und die entsprechenden Forschungsergebnisse wurden in der Arbeit „DexFlyWheel: Ein skalierbares und selbstlernendes Framework zur Datengenerierung für die geschickte Manipulation", wurde von NeurIPS 2025 als Spotlight-Projekt angenommen.

DexFlyWheel ist ein skalierbares Framework zur Datengenerierung, das mithilfe einer selbstoptimierenden Schleife die Datenvielfalt kontinuierlich erweitert. Das Framework zeichnet sich durch zwei zentrale Designmerkmale aus: Introducing Learning (IL) und Residual Reinforcement Learning (RL) zur Generierung menschenähnlicher und vielfältiger Daten. IL und Residual RL bilden in Kombination mit Policy Unrolling und Datenerweiterung eine selbstoptimierende Schleife. In jeder Iteration generiert die Policy Trajektorien, die anschließend in zunehmend vielfältigen Szenarien optimiert und in die nächste Iteration eingespeist werden. Diese Schleife erzeugt einen Schwungradeffekt, der die Datenvielfalt schrittweise erweitert, die Generalisierungsfähigkeit der Policy verbessert und sich zu einem robusten, generalisierbaren Datengenerierungsagenten entwickelt.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp