HyperAI

Dialogue Safety Prediction On Rt Inod

Metriken

Best-of

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameBest-of
benchmarking-llama2-mistral-gemma-and-gpt-for0.91
benchmarking-llama2-mistral-gemma-and-gpt-for0.87
benchmarking-llama2-mistral-gemma-and-gpt-for0.91
benchmarking-llama2-mistral-gemma-and-gpt-for0.86
benchmarking-llama2-mistral-gemma-and-gpt-for0.92