Command Palette
Search for a command to run...
URLB-Datensatz Für Bestärkendes Lernen
Date
Publish URL
URLB steht für Unsupervised Reinforcement Learning Benchmark, ein unüberwachter Reinforcement-Learning-Datensatz. URLB besteht aus zwei Phasen: einer Vortrainingsphase ohne Belohnungen und einer nachgelagerten Aufgabenanpassungsphase mit externen Belohnungen. Basierend auf der DeepMind Control Suite bietet dieser Datensatz 12 kontinuierliche Steuerungsaufgaben aus drei Domänen zur Auswertung.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.