HyperAI

Dialogue Safety Prediction On Rt Inod

Métriques

Best-of

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleBest-of
benchmarking-llama2-mistral-gemma-and-gpt-for0.91
benchmarking-llama2-mistral-gemma-and-gpt-for0.87
benchmarking-llama2-mistral-gemma-and-gpt-for0.91
benchmarking-llama2-mistral-gemma-and-gpt-for0.86
benchmarking-llama2-mistral-gemma-and-gpt-for0.92