HyperAIHyperAI

Command Palette

Search for a command to run...

URLB-Datensatz Für Bestärkendes Lernen

Discuss on Discord

URLB steht für Unsupervised Reinforcement Learning Benchmark, ein unüberwachter Reinforcement-Learning-Datensatz. URLB besteht aus zwei Phasen: einer Vortrainingsphase ohne Belohnungen und einer nachgelagerten Aufgabenanpassungsphase mit externen Belohnungen. Basierend auf der DeepMind Control Suite bietet dieser Datensatz 12 kontinuierliche Steuerungsaufgaben aus drei Domänen zur Auswertung.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp