ReinFlow, Ein Online-Framework Für Verstärktes Lernen
ReinFlow wurde im September 2025 von einem Forschungsteam der Carnegie Mellon University, der Tsinghua University und weiterer Universitäten und Institutionen gemeinsam vorgeschlagen. Die entsprechenden Forschungsergebnisse wurden in der Publikation „…“ veröffentlicht.ReinFlow: Feinabstimmung der Flow-Matching-Richtlinie mit Online-Reinforcement-LearningEs wurde für die NeurIPS 2025 ausgewählt.
ReinFlow ist der erste Online-Reinforcement-Learning-Algorithmus, der eine Reihe von Flow-Matching-Strategien für eine Klasse von Flow-Matching-Strategien in der kontinuierlichen Robotersteuerung stabil feinabstimmen kann. Basierend auf der Theorie des Reinforcement Learnings fügt dieses Paradigma lernbares Rauschen in den deterministischen Pfad der Flow-Strategie ein und transformiert den Flow so in einen diskreten Markov-Prozess. Dies ermöglicht eine genaue und direkte Wahrscheinlichkeitsberechnung. Diese Transformation erleichtert die Exploration und gewährleistet die Stabilität des Trainings, wodurch ReinFlow verschiedene Flow-Modellvarianten stabil feinabstimmen kann, insbesondere mit sehr wenigen oder sogar nur einem einzigen Entrauschungsschritt.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.