HyperAI

Language Modelling

Benchmark-Liste

Alle Benchmarks für diese Aufgabe

100-sleep-nights-of-8-caregivers
Bestes Modell: Gpt3

Metriken

Details anzeigen
2000-hub5-english
Bestes Modell: MMLU

Metriken

Details anzeigen
big-bench-lite-1
Bestes Modell: GLM-130B (3-shot)

Metriken

Details anzeigen
c4
Bestes Modell: Primer

Metriken

Details anzeigen
clue-cmrc2018
Bestes Modell: GLM-130B

Metriken

Details anzeigen
clue-ocnli-50k
Bestes Modell: GLM-130B

Metriken

Details anzeigen
enwik8-dev
Bestes Modell: Transformer-LS (small)

Metriken

Details anzeigen
enwik8
Bestes Modell: GPT-2 (48 layers, h=1600)

Metriken

Details anzeigen
enwiki8
Bestes Modell: PAR Transformer 24B

Metriken

Details anzeigen
hutter-prize
Bestes Modell: Transformer-XL + RMS dynamic eval

Metriken

Details anzeigen
lambada
Bestes Modell: GPT-3 175B (Few-Shot)

Metriken

Details anzeigen
language-modeling-recommendation
Bestes Modell: GPT2

Metriken

Details anzeigen
one-billion-word
Bestes Modell: MDLM (AR baseline)

Metriken

Details anzeigen
openwebtext
Bestes Modell: GPT2-Hermite

Metriken

Details anzeigen
penn-treebank-character-level
Bestes Modell: Mogrifier LSTM + dynamic eval

Metriken

Details anzeigen
penn-treebank-word-level
Bestes Modell: GPT-3 (Zero-Shot)

Metriken

Details anzeigen
ptb
Bestes Modell: I-DARTS

Metriken

Details anzeigen
salmon
Bestes Modell: Spirit-LM (Expr.)

Metriken

Details anzeigen
stackexchange
Bestes Modell: Gopher

Metriken

Details anzeigen
text8
Bestes Modell: GPT-2

Metriken

Details anzeigen
text8-dev
Bestes Modell: Transformer-LS (small)

Metriken

Details anzeigen
the-pile
Bestes Modell: Test-Time Fine-Tuning with SIFT + Llama-3.2 (3B)

Metriken

Details anzeigen
vietmed
Bestes Modell: Hybrid 4-gram VietMed-Train + ExtraText

Metriken

Details anzeigen
wiki-40b
Bestes Modell: FLASH-Quad-8k

Metriken

Details anzeigen
wikitext-103
Bestes Modell: RETRO (7.5B)

Metriken

Details anzeigen
wikitext-2
Bestes Modell: SparseGPT (175B, 50% Sparsity)

Metriken

Details anzeigen
-5

Metriken

Details anzeigen
arxiv

Metriken

Details anzeigen
bookcorpus2

Metriken

Details anzeigen
books3

Metriken

Details anzeigen
clue-afqmc

Metriken

Details anzeigen
clue-c3

Metriken

Details anzeigen
clue-cmnli

Metriken

Details anzeigen
clue-drcd

Metriken

Details anzeigen
clue-wsc1-1

Metriken

Details anzeigen
curation-corpus

Metriken

Details anzeigen
dm-mathematics

Metriken

Details anzeigen
fewclue-bustm

Metriken

Details anzeigen
fewclue-chid-fc

Metriken

Details anzeigen
fewclue-cluewsc-fc

Metriken

Details anzeigen
fewclue-eprstmt

Metriken

Details anzeigen
fewclue-ocnli-fc

Metriken

Details anzeigen
freelaw

Metriken

Details anzeigen
github

Metriken

Details anzeigen
gutenberg-pg-19

Metriken

Details anzeigen
hackernews

Metriken

Details anzeigen
nih-exporter

Metriken

Details anzeigen
opensubtitles-1

Metriken

Details anzeigen
openwebtext2

Metriken

Details anzeigen
philpapers

Metriken

Details anzeigen
pile-cc

Metriken

Details anzeigen
pubmed-abstracts

Metriken

Details anzeigen
pubmed-central

Metriken

Details anzeigen
ubuntu-irc

Metriken

Details anzeigen
uspto-backgrounds

Metriken

Details anzeigen