HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
アドバンテージ重み付き回帰:シンプルかつスケーラブルなオフポリシー強化学習
6ヶ月前
強化学習
モデル学習
監視付き微調整
アプローチ/フレームワーク
概要
論文
ベンチマーク
リソース
nvlabs/gbrl_sb3
pytorch
peisuke/awr
NitinVishalKulkarni/OfflineReinforcementLearning
xbpeng/awr
tf
fomorians-oss/awr
tf
google/trax
jax
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
アドバンテージ重み付き回帰:シンプルかつスケーラブルなオフポリシー強化学習
6ヶ月前
強化学習
モデル学習
監視付き微調整
アプローチ/フレームワーク
概要
論文
ベンチマーク
リソース
nvlabs/gbrl_sb3
pytorch
peisuke/awr
NitinVishalKulkarni/OfflineReinforcementLearning
xbpeng/awr
tf
fomorians-oss/awr
tf
google/trax
jax
リソース - アドバンテージ重み付き回帰:シンプルかつスケーラブルなオフポリシー強化学習 | 記事 | HyperAI超神経
43
43
0
0
3
3
207
207
1
1
8.3k
8.3k