HyperAI

Text Generation On Harmfulqa

Metriken

ASR

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameASR
red-teaming-large-language-models-using-chain65.1