HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
LLM-as-a-Judgeの評価:MT-BenchとChatbot Arenaを用いて
8ヶ月前
ベンチマーク
Preference Modeling
Reasoning
概要
論文
ベンチマーク
リソース
opengvlab/multi-modality-arena
561
pytorch
lm-sys/routellm
4.8k
pytorch
formulamonks/llm-benchmarker-suite
49
pytorch
ojiyumm/mt_bench_rwkv
0
pytorch
lm-sys/fastchat
39.5k
公式
pytorch
ilyagusev/ping_pong_bench
117
theoremone/llm-benchmarker-suite
49
pytorch
PAIR-code/llm-comparator
526
tf
kuk/rulm-sbs2
61
dongping-chen/mllm-as-a-judge
92
pytorch
bjoernpl/fasteval
1
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
LLM-as-a-Judgeの評価:MT-BenchとChatbot Arenaを用いて
8ヶ月前
ベンチマーク
Preference Modeling
Reasoning
概要
論文
ベンチマーク
リソース
opengvlab/multi-modality-arena
561
pytorch
lm-sys/routellm
4.8k
pytorch
formulamonks/llm-benchmarker-suite
49
pytorch
ojiyumm/mt_bench_rwkv
0
pytorch
lm-sys/fastchat
39.5k
公式
pytorch
ilyagusev/ping_pong_bench
117
theoremone/llm-benchmarker-suite
49
pytorch
PAIR-code/llm-comparator
526
tf
kuk/rulm-sbs2
61
dongping-chen/mllm-as-a-judge
92
pytorch
bjoernpl/fasteval
1