HyperAIHyperAI

Command Palette

Search for a command to run...

URLB 강화 학습 데이터 세트

Discord에서 논의하기

URLB는 Unsupervised Reinforcement Learning Benchmark의 약자로, 비지도 강화 학습 데이터 세트입니다. URLB는 두 단계로 구성됩니다. 보상이 없는 사전 학습 단계와 외부 보상이 있는 하위 작업 적응 단계입니다. DeepMind Control Suite를 기반으로 하는 이 데이터 세트는 평가를 위해 3개 도메인의 12개 연속 제어 작업을 제공합니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
URLB 강화 학습 데이터 세트 | 데이터 세트 | HyperAI초신경