HyperAI超神経
ホーム
ニュース
最新論文
チュートリアル
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
日本語
HyperAI超神経
Toggle sidebar
サイトを検索…
⌘
K
ホーム
SOTA
Dialogue Safety Prediction
Dialogue Safety Prediction On Rt Inod
Dialogue Safety Prediction On Rt Inod
評価指標
Best-of
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
Columns
モデル名
Best-of
Paper Title
Repository
Gemma
0.91
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
Mistral
0.87
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
GPT-4
0.91
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
Llama2
0.86
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
Baseline
0.92
Benchmarking Llama2, Mistral, Gemma and GPT for Factuality, Toxicity, Bias and Propensity for Hallucinations
-
0 of 5 row(s) selected.
Previous
Next