HyperAI
HyperAI초신경
홈
플랫폼
문서
뉴스
연구 논문
튜토리얼
데이터셋
백과사전
SOTA
LLM 모델
GPU 랭킹
컨퍼런스
전체 검색
소개
서비스 약관
개인정보 처리방침
한국어
HyperAI
HyperAI초신경
Toggle Sidebar
전체 사이트 검색...
⌘
K
Command Palette
Search for a command to run...
플랫폼
홈
SOTA
오픈AI 짐
Openai Gym On Ant V2
Openai Gym On Ant V2
평가 지표
Mean Reward
평가 결과
이 벤치마크에서 각 모델의 성능 결과
Columns
모델 이름
Mean Reward
Paper Title
TLA
5163.54
Optimizing Attention and Cognitive Control Costs Using Temporally-Layered Architectures
AWR
5067
Advantage-Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning
0 of 2 row(s) selected.
Previous
Next
Openai Gym On Ant V2 | SOTA | HyperAI초신경