HyperAI초신경

Logical Reasoning On Ruworldtree

평가 지표

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Accuracy
tape-assessing-few-shot-russian-language38.0
tape-assessing-few-shot-russian-language83.7
tape-assessing-few-shot-russian-language34.0
tape-assessing-few-shot-russian-language40.7