HyperAI초신경

홈 뉴스 연구 논문 튜토리얼 데이터셋 백과사전 SOTA LLM 모델 GPU 랭킹 컨퍼런스

한국어

HyperAI초신경

Language Modelling On C4

평가 지표

Perplexity

Steps

TPUv3 Hours

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름	Perplexity	Steps	TPUv3 Hours	Paper Title	Repository
T5++	12.69	1M	16.5K	Primer: Searching for Efficient Transformers for Language Modeling
Zeropoint LLM.int8 13B (vector-wise + decomp)	12.45	-	-	LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale
Original T5	13.25	1M	15.7K	Primer: Searching for Efficient Transformers for Language Modeling
N-Grammer 343M	14.79	-	-	N-Grammer: Augmenting Transformers with latent n-grams
LLM.float32 2.7B	14.43	-	-	LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale
LLM.float32 1.3B	15.91	-	-	LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale
Primer	12.35	1M	17.3K	Primer: Searching for Efficient Transformers for Language Modeling
N-Grammer 288M	15.01	-	-	N-Grammer: Augmenting Transformers with latent n-grams
LLM.float32 6.7B	13.3	-	-	LLM.int8(): 8-bit Matrix Multiplication for Transformers at Scale

0 of 9 row(s) selected.