Text Generation On Openwebtext

eval_loss

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title	Repository
GPT2-124M	3.12	Language Models are Unsupervised Multitask Learners	-
GPT2-81M-LOOP	3.11	Loop Neural Networks for Parameter Sharing	-
GPT2-Hermite	2.91	Polynomial, trigonometric, and tropical activations

0 of 3 row(s) selected.