Word Sense Disambiguation On Big Bench

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

		Paper Title
Chinchilla-70B (few-shot, k=5)	69.1	Training Compute-Optimal Large Language Models
Gopher-280B (few-shot, k=5)	56.4	Scaling Language Models: Methods, Analysis & Insights from Training Gopher
OPT 175B	49.1	Galactica: A Large Language Model for Science
GAL 120B (few-shot, k=5)	48.7	Galactica: A Large Language Model for Science
GAL 30B (few-shot, k=5)	47.0	Galactica: A Large Language Model for Science
BLOOM 176B	1.3	Galactica: A Large Language Model for Science

0 of 6 row(s) selected.