Question Answering On Ruopenbookqa

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title
Human benchmark	86.5	TAPE: Assessing Few-shot Russian Language Understanding
RuGPT-3 Small	57.9	TAPE: Assessing Few-shot Russian Language Understanding
RuGPT-3 Medium	57.2	TAPE: Assessing Few-shot Russian Language Understanding
RuGPT-3 Large	55.5	TAPE: Assessing Few-shot Russian Language Understanding

0 of 4 row(s) selected.