날짜

4년 전

게시 URL

태그

URLB는 Unsupervised Reinforcement Learning Benchmark의 약자로, 비지도 강화 학습 데이터 세트입니다. URLB는 두 단계로 구성됩니다. 보상이 없는 사전 학습 단계와 외부 보상이 있는 하위 작업 적응 단계입니다. DeepMind Control Suite를 기반으로 하는 이 데이터 세트는 평가를 위해 3개 도메인의 12개 연속 제어 작업을 제공합니다.

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

Discord에서 논의하기

날짜

4년 전

게시 URL

태그

undefined

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

URLB 강화 학습 데이터 세트 | 데이터 세트 | HyperAI초신경

Command Palette

URLB 강화 학습 데이터 세트

AI로 AI 구축

HyperAI Newsletters

Command Palette

URLB 강화 학습 데이터 세트

undefined

DRACO 학제간 심층 연구 벤치마크 데이터셋

CL-bench 컨텍스트 학습 평가 벤치마크 데이터셋

MCIF 다중모드 다국어 교육 데이터셋

AI로 AI 구축

HyperAI Newsletters

Command Palette

URLB 강화 학습 데이터 세트

undefined

DRACO 학제간 심층 연구 벤치마크 데이터셋

CL-bench 컨텍스트 학습 평가 벤치마크 데이터셋

MCIF 다중모드 다국어 교육 데이터셋

AI로 AI 구축

HyperAI Newsletters

undefined

DRACO 학제간 심층 연구 벤치마크 데이터셋

CL-bench 컨텍스트 학습 평가 벤치마크 데이터셋

MCIF 다중모드 다국어 교육 데이터셋

undefined

DRACO 학제간 심층 연구 벤치마크 데이터셋

CL-bench 컨텍스트 학습 평가 벤치마크 데이터셋

MCIF 다중모드 다국어 교육 데이터셋