URLB-Datensatz Für Bestärkendes Lernen
Datum
vor 3 Jahren
Veröffentlichungs-URL
URLB steht für Unsupervised Reinforcement Learning Benchmark, ein unüberwachter Reinforcement-Learning-Datensatz. URLB besteht aus zwei Phasen: einer Vortrainingsphase ohne Belohnungen und einer nachgelagerten Aufgabenanpassungsphase mit externen Belohnungen. Basierend auf der DeepMind Control Suite bietet dieser Datensatz 12 kontinuierliche Steuerungsaufgaben aus drei Domänen zur Auswertung.