HyperAI초신경

Legal Reasoning On Legalbench Issue Spotting

평가 지표

Balanced Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름
Balanced Accuracy
Paper TitleRepository
GPT-3.560.9--
GPT-482.9--
Claude-158.1--
0 of 3 row(s) selected.