HyperAI超神経

Mmsql Performance On Mmsql

評価指標

TDEX

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名TDEX
evaluating-and-enhancing-llms-for-multi-turn30.7
evaluating-and-enhancing-llms-for-multi-turn65.8
evaluating-and-enhancing-llms-for-multi-turn64.0
evaluating-and-enhancing-llms-for-multi-turn67.0
evaluating-and-enhancing-llms-for-multi-turn62.8
evaluating-and-enhancing-llms-for-multi-turn64.1