HyperAIHyperAI

Command Palette

Search for a command to run...

ReinFlow, Ein Online-Framework Für Verstärktes Lernen

Date

vor 2 Monaten

Organization

Carnegie Mellon Universität

Paper URL

2505.22094

ReinFlow wurde im September 2025 von einem Forschungsteam der Carnegie Mellon University, der Tsinghua University und weiterer Universitäten und Institutionen gemeinsam vorgeschlagen. Die entsprechenden Forschungsergebnisse wurden in der Publikation „…“ veröffentlicht.ReinFlow: Feinabstimmung der Flow-Matching-Richtlinie mit Online-Reinforcement-LearningEs wurde für die NeurIPS 2025 ausgewählt.

ReinFlow ist der erste Online-Reinforcement-Learning-Algorithmus, der eine Reihe von Flow-Matching-Strategien für eine Klasse von Flow-Matching-Strategien in der kontinuierlichen Robotersteuerung stabil feinabstimmen kann. Basierend auf der Theorie des Reinforcement Learnings fügt dieses Paradigma lernbares Rauschen in den deterministischen Pfad der Flow-Strategie ein und transformiert den Flow so in einen diskreten Markov-Prozess. Dies ermöglicht eine genaue und direkte Wahrscheinlichkeitsberechnung. Diese Transformation erleichtert die Exploration und gewährleistet die Stabilität des Trainings, wodurch ReinFlow verschiedene Flow-Modellvarianten stabil feinabstimmen kann, insbesondere mit sehr wenigen oder sogar nur einem einzigen Entrauschungsschritt.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp