HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
LLM-as-a-Judgeの評価:MT-BenchとChatbot Arenaを用いて
6ヶ月前
ベンチマーク
Preference Modeling
Reasoning
AIインフラストラクチャ
アプローチ/フレームワーク
自然言語処理
タスク
概要
論文
ベンチマーク
リソース
opengvlab/multi-modality-arena
pytorch
lm-sys/routellm
pytorch
formulamonks/llm-benchmarker-suite
pytorch
ojiyumm/mt_bench_rwkv
pytorch
lm-sys/fastchat
公式
pytorch
ilyagusev/ping_pong_bench
theoremone/llm-benchmarker-suite
pytorch
PAIR-code/llm-comparator
tf
kuk/rulm-sbs2
dongping-chen/mllm-as-a-judge
pytorch
bjoernpl/fasteval
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
LLM-as-a-Judgeの評価:MT-BenchとChatbot Arenaを用いて
6ヶ月前
ベンチマーク
Preference Modeling
Reasoning
AIインフラストラクチャ
アプローチ/フレームワーク
自然言語処理
タスク
概要
論文
ベンチマーク
リソース
opengvlab/multi-modality-arena
pytorch
lm-sys/routellm
pytorch
formulamonks/llm-benchmarker-suite
pytorch
ojiyumm/mt_bench_rwkv
pytorch
lm-sys/fastchat
公式
pytorch
ilyagusev/ping_pong_bench
theoremone/llm-benchmarker-suite
pytorch
PAIR-code/llm-comparator
tf
kuk/rulm-sbs2
dongping-chen/mllm-as-a-judge
pytorch
bjoernpl/fasteval
556
556
4.6k
4.6k
48
48
0
0
39.4k
39.4k
115
115
48
48
520
520
61
61
89
89
1
1