HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
最新動向
ニュース
資料
書類
ノート
データセット
Wiki
ベンチマーク
最先端
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイト内を検索…
⌘
K
Command Palette
Search for a command to run...
Sign In
HyperAI
Papers
人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練
4ヶ月前
Preference Modeling
強化学習
LLM
Summary
Paper
Resources
miaoyuchun/inform
13
pytorch
ganjinzero/rrhf
809
pytorch
ethz-spylab/rlhf_trojan_competition
116
pytorch
anthropics/hh-rlhf
1.8k
Official
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
最新動向
ニュース
資料
書類
ノート
データセット
Wiki
ベンチマーク
最先端
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイト内を検索…
⌘
K
Command Palette
Search for a command to run...
Sign In
HyperAI
Papers
人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練
4ヶ月前
Preference Modeling
強化学習
LLM
Summary
Paper
Resources
miaoyuchun/inform
13
pytorch
ganjinzero/rrhf
809
pytorch
ethz-spylab/rlhf_trojan_competition
116
pytorch
anthropics/hh-rlhf
1.8k
Official
Resources - 人間からのフィードバックを用いた強化学習による、有用かつ無害なアシスタントの訓練 | Papers | HyperAI超神経