HyperAI超神経
ホーム
ニュース
最新論文
チュートリアル
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
日本語
システム
HyperAI超神経
Toggle sidebar
サイトを検索…
⌘
K
ログイン
ログイン
ホーム
SOTA
Bias Detection
Bias Detection On Rt Inod Bias
Bias Detection On Rt Inod Bias
評価指標
Best-of
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
Columns
モデル名
Best-of
Paper Title
Repository
Mistral
0.36
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
Llama2
0.34
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
Gemma
0.41
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
Baseline
0.41
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
GPT-4
0.5
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
0 of 5 row(s) selected.
Previous
Next