Logical Reasoning On Ruworldtree

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Accuracy	Paper Title
RuGPT-3 Medium	38.0	TAPE: Assessing Few-shot Russian Language Understanding
Human benchmark	83.7	TAPE: Assessing Few-shot Russian Language Understanding
RuGPT-3 Small	34.0	TAPE: Assessing Few-shot Russian Language Understanding
RuGPT-3 Large	40.7	TAPE: Assessing Few-shot Russian Language Understanding

0 of 4 row(s) selected.