HyperAI초신경

Logical Reasoning On Winograd Automatic

평가 지표

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Accuracy
tape-assessing-few-shot-russian-language57.9
tape-assessing-few-shot-russian-language57.2
tape-assessing-few-shot-russian-language87.0
tape-assessing-few-shot-russian-language55.5