HyperAI초신경

홈 뉴스 연구 논문 튜토리얼 데이터셋 백과사전 SOTA LLM 모델 GPU 랭킹 컨퍼런스

한국어

HyperAI초신경

Smac On Smac Off Complicated Parallel

평가 지표

Median Win Rate

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Median Win Rate	Paper Title	Repository
IQL	35.0	-	-
MASAC	0.0	Decomposed Soft Actor-Critic Method for Cooperative Multi-Agent Reinforcement Learning
DRIMA	100	Disentangling Sources of Risk for Distributional Multi-Agent Reinforcement Learning	-
DMIX	0.0	DFAC Framework: Factorizing the Value Function via Quantile Mixture for Multi-Agent Distributional Q-Learning
QMIX	0.0	QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning
COMA	0.0	Counterfactual Multi-Agent Policy Gradients
DDN	0.0	DFAC Framework: Factorizing the Value Function via Quantile Mixture for Multi-Agent Distributional Q-Learning
VDN	70.0	Value-Decomposition Networks For Cooperative Multi-Agent Learning
DIQL	0.0	DFAC Framework: Factorizing the Value Function via Quantile Mixture for Multi-Agent Distributional Q-Learning
QTRAN	0.0	QTRAN: Learning to Factorize with Transformation for Cooperative Multi-Agent Reinforcement Learning

0 of 10 row(s) selected.