Bias Detection On Rt Inod Bias
Métriques
Best-of
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Best-of |
---|---|
benchmarking-llama2-mistral-gemma-and-gpt-for | 0.36 |
benchmarking-llama2-mistral-gemma-and-gpt-for | 0.34 |
benchmarking-llama2-mistral-gemma-and-gpt-for | 0.41 |
benchmarking-llama2-mistral-gemma-and-gpt-for | 0.41 |
benchmarking-llama2-mistral-gemma-and-gpt-for | 0.5 |