HyperAI

URLB-Datensatz Für Bestärkendes Lernen

Datum

vor 3 Jahren

Veröffentlichungs-URL

github.com

Download-Hilfe

URLB steht für Unsupervised Reinforcement Learning Benchmark, ein unüberwachter Reinforcement-Learning-Datensatz. URLB besteht aus zwei Phasen: einer Vortrainingsphase ohne Belohnungen und einer nachgelagerten Aufgabenanpassungsphase mit externen Belohnungen. Basierend auf der DeepMind Control Suite bietet dieser Datensatz 12 kontinuierliche Steuerungsaufgaben aus drei Domänen zur Auswertung.