Ethics On Ethics

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Accuracy	Paper Title
RuGPT-3 Large	68.6	TAPE: Assessing Few-shot Russian Language Understanding
Human benchmark	52.9	TAPE: Assessing Few-shot Russian Language Understanding
RuGPT-3 Meduim	68.3	TAPE: Assessing Few-shot Russian Language Understanding
RuGPT-3 Small	55.5	TAPE: Assessing Few-shot Russian Language Understanding

0 of 4 row(s) selected.