Word Sense Disambiguation On Big Bench

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title
Chinchilla-70B (few-shot, k=5)	69.1	Training Compute-Optimal Large Language Models
Gopher-280B (few-shot, k=5)	56.4	Scaling Language Models: Methods, Analysis & Insights from Training Gopher
OPT 175B	49.1	Galactica: A Large Language Model for Science
GAL 120B (few-shot, k=5)	48.7	Galactica: A Large Language Model for Science
GAL 30B (few-shot, k=5)	47.0	Galactica: A Large Language Model for Science
BLOOM 176B	1.3	Galactica: A Large Language Model for Science

0 of 6 row(s) selected.