HyperAI

Text Generation

Benchmark-Liste

Alle Benchmarks für diese Aufgabe

chinese-poems
Bestes Modell: RankGAN

Metriken

Details anzeigen
cmu-se
Bestes Modell: STWGAN-GP

Metriken

Details anzeigen
cnn-daily-mail-1
Bestes Modell: PALM

Metriken

Details anzeigen
coco-captions
Bestes Modell: LeakGAN

Metriken

Details anzeigen
commongen
Bestes Modell: UniLM

Metriken

Details anzeigen
emnlp2017-wmt
Bestes Modell: LeakGAN

Metriken

Details anzeigen
harmfulqa
Bestes Modell: GPT-4

Metriken

Details anzeigen
one-billion-word
Bestes Modell: WGANGP + DGflow

Metriken

Details anzeigen
redial
Bestes Modell: UniCRS

Metriken

Details anzeigen
rocstories
Bestes Modell: Beam search + A*esque (sample)

Metriken

Details anzeigen
yahoo-questions
Bestes Modell: Aggressive VAE

Metriken

Details anzeigen
adgen

Metriken

Details anzeigen
ai2-reasoning-challenge-25-shot

Metriken

Details anzeigen
ai2-reasoning-challenge-tr

Metriken

Details anzeigen
alpaca-eval-pt

Metriken

Details anzeigen
alpacaeval

Metriken

Details anzeigen
arc-challenge-pt

Metriken

Details anzeigen
assin2-rte

Metriken

Details anzeigen
assin2-sts

Metriken

Details anzeigen
bbh-3-shot

Metriken

Details anzeigen
bluex-no-images

Metriken

Details anzeigen
calame-pt

Metriken

Details anzeigen
censorship-0-shot

Metriken

Details anzeigen
creativity-0-shot

Metriken

Details anzeigen
crimestats

Metriken

Details anzeigen
csl

Metriken

Details anzeigen
czech-restaurant-information

Metriken

Details anzeigen
dailydialog

Metriken

Details anzeigen
dart

Metriken

Details anzeigen
drop-3-shot

Metriken

Details anzeigen
enem-challenge-no-images

Metriken

Details anzeigen
faquad-nli

Metriken

Details anzeigen
gpqa-0-shot

Metriken

Details anzeigen
gsm8k-5-shot

Metriken

Details anzeigen
gsm8k-tr

Metriken

Details anzeigen
hatebr-binary

Metriken

Details anzeigen
hellaswag-10-shot

Metriken

Details anzeigen
hellaswag-pt

Metriken

Details anzeigen
hellaswag-tr

Metriken

Details anzeigen
humanness-0-shot

Metriken

Details anzeigen
ifeval-0-shot

Metriken

Details anzeigen
internet

Metriken

Details anzeigen
lambada-pt

Metriken

Details anzeigen
lcsts

Metriken

Details anzeigen
ldc2016e25

Metriken

Details anzeigen
math-lvl-5-4-shot

Metriken

Details anzeigen
mmlu-5-shot

Metriken

Details anzeigen
mmlu-pro-5-shot

Metriken

Details anzeigen
mmlu-tr

Metriken

Details anzeigen
mt-bench

Metriken

Details anzeigen
mt-bench-jp

Metriken

Details anzeigen
musr-0-shot

Metriken

Details anzeigen
oab-exams

Metriken

Details anzeigen
open-mindedness-0-shot

Metriken

Details anzeigen
openwebtext

Metriken

Details anzeigen
polcontro

Metriken

Details anzeigen
pt-hate-speech-binary

Metriken

Details anzeigen
sciq

Metriken

Details anzeigen
stories-jokes

Metriken

Details anzeigen
talking-0-shot

Metriken

Details anzeigen
truthfulqa

Metriken

Details anzeigen
truthfulqa-0-shot

Metriken

Details anzeigen
truthfulqa-pt

Metriken

Details anzeigen
truthfulqa-tr

Metriken

Details anzeigen
tweetsentbr

Metriken

Details anzeigen
unruly

Metriken

Details anzeigen
w-10

Metriken

Details anzeigen
wikitext-103

Metriken

Details anzeigen
winogrande-5-shot

Metriken

Details anzeigen
winogrande-tr

Metriken

Details anzeigen
world-knowledge-0-shot

Metriken

Details anzeigen