Text Generation
Benchmark-Liste
Alle Benchmarks für diese Aufgabe
chinese-poems
Bestes Modell: RankGAN
Metriken
Details anzeigen
cmu-se
Bestes Modell: STWGAN-GP
Metriken
Details anzeigen
cnn-daily-mail-1
Bestes Modell: PALM
Metriken
Details anzeigen
coco-captions
Bestes Modell: LeakGAN
Metriken
Details anzeigen
commongen
Bestes Modell: UniLM
Metriken
Details anzeigen
emnlp2017-wmt
Bestes Modell: LeakGAN
Metriken
Details anzeigen
harmfulqa
Bestes Modell: GPT-4
Metriken
Details anzeigen
one-billion-word
Bestes Modell: WGANGP + DGflow
Metriken
Details anzeigen
redial
Bestes Modell: UniCRS
Metriken
Details anzeigen
rocstories
Bestes Modell: Beam search + A*esque (sample)
Metriken
Details anzeigen
yahoo-questions
Bestes Modell: Aggressive VAE
Metriken
Details anzeigen
adgen
Metriken
Details anzeigen
ai2-reasoning-challenge-25-shot
Metriken
Details anzeigen
ai2-reasoning-challenge-tr
Metriken
Details anzeigen
alpaca-eval-pt
Metriken
Details anzeigen
alpacaeval
Metriken
Details anzeigen
arc-challenge-pt
Metriken
Details anzeigen
assin2-rte
Metriken
Details anzeigen
assin2-sts
Metriken
Details anzeigen
bbh-3-shot
Metriken
Details anzeigen
bluex-no-images
Metriken
Details anzeigen
calame-pt
Metriken
Details anzeigen
censorship-0-shot
Metriken
Details anzeigen
creativity-0-shot
Metriken
Details anzeigen
crimestats
Metriken
Details anzeigen
csl
Metriken
Details anzeigen
czech-restaurant-information
Metriken
Details anzeigen
dailydialog
Metriken
Details anzeigen
dart
Metriken
Details anzeigen
drop-3-shot
Metriken
Details anzeigen
enem-challenge-no-images
Metriken
Details anzeigen
faquad-nli
Metriken
Details anzeigen
gpqa-0-shot
Metriken
Details anzeigen
gsm8k-5-shot
Metriken
Details anzeigen
gsm8k-tr
Metriken
Details anzeigen
hatebr-binary
Metriken
Details anzeigen
hellaswag-10-shot
Metriken
Details anzeigen
hellaswag-pt
Metriken
Details anzeigen
hellaswag-tr
Metriken
Details anzeigen
humanness-0-shot
Metriken
Details anzeigen
ifeval-0-shot
Metriken
Details anzeigen
internet
Metriken
Details anzeigen
lambada-pt
Metriken
Details anzeigen
lcsts
Metriken
Details anzeigen
ldc2016e25
Metriken
Details anzeigen
math-lvl-5-4-shot
Metriken
Details anzeigen
mmlu-5-shot
Metriken
Details anzeigen
mmlu-pro-5-shot
Metriken
Details anzeigen
mmlu-tr
Metriken
Details anzeigen
mt-bench
Metriken
Details anzeigen
mt-bench-jp
Metriken
Details anzeigen
musr-0-shot
Metriken
Details anzeigen
oab-exams
Metriken
Details anzeigen
open-mindedness-0-shot
Metriken
Details anzeigen
openwebtext
Metriken
Details anzeigen
polcontro
Metriken
Details anzeigen
pt-hate-speech-binary
Metriken
Details anzeigen
sciq
Metriken
Details anzeigen
stories-jokes
Metriken
Details anzeigen
talking-0-shot
Metriken
Details anzeigen
truthfulqa
Metriken
Details anzeigen
truthfulqa-0-shot
Metriken
Details anzeigen
truthfulqa-pt
Metriken
Details anzeigen
truthfulqa-tr
Metriken
Details anzeigen
tweetsentbr
Metriken
Details anzeigen
unruly
Metriken
Details anzeigen
w-10
Metriken
Details anzeigen
wikitext-103
Metriken
Details anzeigen
winogrande-5-shot
Metriken
Details anzeigen
winogrande-tr
Metriken
Details anzeigen
world-knowledge-0-shot
Metriken
Details anzeigen