HyperAIHyperAI

Command Palette

Search for a command to run...

ReinFlow, Ein Online-Framework Für Verstärktes Lernen

Datum

vor 4 Tagen

Organisation

Carnegie Mellon Universität
Tsinghua-Universität

Paper-URL

2505.22094

ReinFlow wurde im September 2025 von einem Forschungsteam der Carnegie Mellon University, der Tsinghua University und weiterer Universitäten und Institutionen gemeinsam vorgeschlagen. Die entsprechenden Forschungsergebnisse wurden in der Publikation „…“ veröffentlicht.ReinFlow: Feinabstimmung der Flow-Matching-Richtlinie mit Online-Reinforcement-LearningEs wurde für die NeurIPS 2025 ausgewählt.

ReinFlow ist der erste Online-Reinforcement-Learning-Algorithmus, der eine Reihe von Flow-Matching-Strategien für eine Klasse von Flow-Matching-Strategien in der kontinuierlichen Robotersteuerung stabil feinabstimmen kann. Basierend auf der Theorie des Reinforcement Learnings fügt dieses Paradigma lernbares Rauschen in den deterministischen Pfad der Flow-Strategie ein und transformiert den Flow so in einen diskreten Markov-Prozess. Dies ermöglicht eine genaue und direkte Wahrscheinlichkeitsberechnung. Diese Transformation erleichtert die Exploration und gewährleistet die Stabilität des Trainings, wodurch ReinFlow verschiedene Flow-Modellvarianten stabil feinabstimmen kann, insbesondere mit sehr wenigen oder sogar nur einem einzigen Entrauschungsschritt.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
ReinFlow, Ein Online-Framework Für Verstärktes Lernen | Wiki | HyperAI