HyperAI超神経

Bias Detection On Rt Inod Bias

評価指標

Best-of

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Best-of
benchmarking-llama2-mistral-gemma-and-gpt-for0.36
benchmarking-llama2-mistral-gemma-and-gpt-for0.34
benchmarking-llama2-mistral-gemma-and-gpt-for0.41
benchmarking-llama2-mistral-gemma-and-gpt-for0.41
benchmarking-llama2-mistral-gemma-and-gpt-for0.5