HyperAI超神経

Legal Reasoning On Legalbench Issue Spotting

評価指標

Balanced Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
Balanced Accuracy
Paper TitleRepository
GPT-3.560.9--
GPT-482.9--
Claude-158.1--
0 of 3 row(s) selected.