HyperAI

Text Generation

Liste des benchmarks

Tous les benchmarks liés à cette tâche

chinese-poems
Meilleur modèle: RankGAN

Métriques

Voir les détails
cmu-se
Meilleur modèle: STWGAN-GP

Métriques

Voir les détails
cnn-daily-mail-1
Meilleur modèle: PALM

Métriques

Voir les détails
coco-captions
Meilleur modèle: LeakGAN

Métriques

Voir les détails
commongen
Meilleur modèle: UniLM

Métriques

Voir les détails
emnlp2017-wmt
Meilleur modèle: LeakGAN

Métriques

Voir les détails
harmfulqa
Meilleur modèle: GPT-4

Métriques

Voir les détails
one-billion-word
Meilleur modèle: WGANGP + DGflow

Métriques

Voir les détails
redial
Meilleur modèle: UniCRS

Métriques

Voir les détails
rocstories
Meilleur modèle: Beam search + A*esque (sample)

Métriques

Voir les détails
yahoo-questions
Meilleur modèle: Aggressive VAE

Métriques

Voir les détails
adgen

Métriques

Voir les détails
ai2-reasoning-challenge-25-shot

Métriques

Voir les détails
ai2-reasoning-challenge-tr

Métriques

Voir les détails
alpaca-eval-pt

Métriques

Voir les détails
alpacaeval

Métriques

Voir les détails
arc-challenge-pt

Métriques

Voir les détails
assin2-rte

Métriques

Voir les détails
assin2-sts

Métriques

Voir les détails
bbh-3-shot

Métriques

Voir les détails
bluex-no-images

Métriques

Voir les détails
calame-pt

Métriques

Voir les détails
censorship-0-shot

Métriques

Voir les détails
creativity-0-shot

Métriques

Voir les détails
crimestats

Métriques

Voir les détails
csl

Métriques

Voir les détails
czech-restaurant-information

Métriques

Voir les détails
dailydialog

Métriques

Voir les détails
dart

Métriques

Voir les détails
drop-3-shot

Métriques

Voir les détails
enem-challenge-no-images

Métriques

Voir les détails
faquad-nli

Métriques

Voir les détails
gpqa-0-shot

Métriques

Voir les détails
gsm8k-5-shot

Métriques

Voir les détails
gsm8k-tr

Métriques

Voir les détails
hatebr-binary

Métriques

Voir les détails
hellaswag-10-shot

Métriques

Voir les détails
hellaswag-pt

Métriques

Voir les détails
hellaswag-tr

Métriques

Voir les détails
humanness-0-shot

Métriques

Voir les détails
ifeval-0-shot

Métriques

Voir les détails
internet

Métriques

Voir les détails
lambada-pt

Métriques

Voir les détails
lcsts

Métriques

Voir les détails
ldc2016e25

Métriques

Voir les détails
math-lvl-5-4-shot

Métriques

Voir les détails
mmlu-5-shot

Métriques

Voir les détails
mmlu-pro-5-shot

Métriques

Voir les détails
mmlu-tr

Métriques

Voir les détails
mt-bench

Métriques

Voir les détails
mt-bench-jp

Métriques

Voir les détails
musr-0-shot

Métriques

Voir les détails
oab-exams

Métriques

Voir les détails
open-mindedness-0-shot

Métriques

Voir les détails
openwebtext

Métriques

Voir les détails
polcontro

Métriques

Voir les détails
pt-hate-speech-binary

Métriques

Voir les détails
sciq

Métriques

Voir les détails
stories-jokes

Métriques

Voir les détails
talking-0-shot

Métriques

Voir les détails
truthfulqa

Métriques

Voir les détails
truthfulqa-0-shot

Métriques

Voir les détails
truthfulqa-pt

Métriques

Voir les détails
truthfulqa-tr

Métriques

Voir les détails
tweetsentbr

Métriques

Voir les détails
unruly

Métriques

Voir les détails
w-10

Métriques

Voir les détails
wikitext-103

Métriques

Voir les détails
winogrande-5-shot

Métriques

Voir les détails
winogrande-tr

Métriques

Voir les détails
world-knowledge-0-shot

Métriques

Voir les détails