Language Modelling On Wiki 40B
Métriques
Perplexity
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Perplexity |
---|---|
transformer-quality-in-linear-time | 14.998 |
combiner-full-attention-transformer-with | 16.49 |
combiner-full-attention-transformer-with | 16.60 |