HyperAI초신경

Mmsql Performance On Mmsql

평가 지표

TDEX

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름TDEX
evaluating-and-enhancing-llms-for-multi-turn30.7
evaluating-and-enhancing-llms-for-multi-turn65.8
evaluating-and-enhancing-llms-for-multi-turn64.0
evaluating-and-enhancing-llms-for-multi-turn67.0
evaluating-and-enhancing-llms-for-multi-turn62.8
evaluating-and-enhancing-llms-for-multi-turn64.1