Command Palette
Search for a command to run...
URLB-Datensatz Für Bestärkendes Lernen
Datum
vor 3 Jahren
Veröffentlichungs-URL
URLB steht für Unsupervised Reinforcement Learning Benchmark, ein unüberwachter Reinforcement-Learning-Datensatz. URLB besteht aus zwei Phasen: einer Vortrainingsphase ohne Belohnungen und einer nachgelagerten Aufgabenanpassungsphase mit externen Belohnungen. Basierend auf der DeepMind Control Suite bietet dieser Datensatz 12 kontinuierliche Steuerungsaufgaben aus drei Domänen zur Auswertung.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.
KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Hyper Newsletters
Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp