DexFlyWheel-Datengenerierungsframework
DexFlyWheel wurde im September 2025 von der Peking-Universität, dem Harbin Institute of Technology und PsiBot vorgeschlagen, und die entsprechenden Forschungsergebnisse wurden in der Arbeit „DexFlyWheel: Ein skalierbares und selbstlernendes Framework zur Datengenerierung für die geschickte Manipulation", wurde von NeurIPS 2025 als Spotlight-Projekt angenommen.
DexFlyWheel ist ein skalierbares Framework zur Datengenerierung, das mithilfe einer selbstoptimierenden Schleife die Datenvielfalt kontinuierlich erweitert. Das Framework zeichnet sich durch zwei zentrale Designmerkmale aus: Introducing Learning (IL) und Residual Reinforcement Learning (RL) zur Generierung menschenähnlicher und vielfältiger Daten. IL und Residual RL bilden in Kombination mit Policy Unrolling und Datenerweiterung eine selbstoptimierende Schleife. In jeder Iteration generiert die Policy Trajektorien, die anschließend in zunehmend vielfältigen Szenarien optimiert und in die nächste Iteration eingespeist werden. Diese Schleife erzeugt einen Schwungradeffekt, der die Datenvielfalt schrittweise erweitert, die Generalisierungsfähigkeit der Policy verbessert und sich zu einem robusten, generalisierbaren Datengenerierungsagenten entwickelt.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.