HyperAI초신경

Text Generation On Harmfulqa

평가 지표

ASR

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름ASR
red-teaming-large-language-models-using-chain65.1