Text Generation
Liste des benchmarks
Tous les benchmarks liés à cette tâche
chinese-poems
Meilleur modèle: RankGAN
Métriques
Voir les détails
cmu-se
Meilleur modèle: STWGAN-GP
Métriques
Voir les détails
cnn-daily-mail-1
Meilleur modèle: PALM
Métriques
Voir les détails
coco-captions
Meilleur modèle: LeakGAN
Métriques
Voir les détails
commongen
Meilleur modèle: UniLM
Métriques
Voir les détails
emnlp2017-wmt
Meilleur modèle: LeakGAN
Métriques
Voir les détails
harmfulqa
Meilleur modèle: GPT-4
Métriques
Voir les détails
one-billion-word
Meilleur modèle: WGANGP + DGflow
Métriques
Voir les détails
redial
Meilleur modèle: UniCRS
Métriques
Voir les détails
rocstories
Meilleur modèle: Beam search + A*esque (sample)
Métriques
Voir les détails
yahoo-questions
Meilleur modèle: Aggressive VAE
Métriques
Voir les détails
adgen
Métriques
Voir les détails
ai2-reasoning-challenge-25-shot
Métriques
Voir les détails
ai2-reasoning-challenge-tr
Métriques
Voir les détails
alpaca-eval-pt
Métriques
Voir les détails
alpacaeval
Métriques
Voir les détails
arc-challenge-pt
Métriques
Voir les détails
assin2-rte
Métriques
Voir les détails
assin2-sts
Métriques
Voir les détails
bbh-3-shot
Métriques
Voir les détails
bluex-no-images
Métriques
Voir les détails
calame-pt
Métriques
Voir les détails
censorship-0-shot
Métriques
Voir les détails
creativity-0-shot
Métriques
Voir les détails
crimestats
Métriques
Voir les détails
csl
Métriques
Voir les détails
czech-restaurant-information
Métriques
Voir les détails
dailydialog
Métriques
Voir les détails
dart
Métriques
Voir les détails
drop-3-shot
Métriques
Voir les détails
enem-challenge-no-images
Métriques
Voir les détails
faquad-nli
Métriques
Voir les détails
gpqa-0-shot
Métriques
Voir les détails
gsm8k-5-shot
Métriques
Voir les détails
gsm8k-tr
Métriques
Voir les détails
hatebr-binary
Métriques
Voir les détails
hellaswag-10-shot
Métriques
Voir les détails
hellaswag-pt
Métriques
Voir les détails
hellaswag-tr
Métriques
Voir les détails
humanness-0-shot
Métriques
Voir les détails
ifeval-0-shot
Métriques
Voir les détails
internet
Métriques
Voir les détails
lambada-pt
Métriques
Voir les détails
lcsts
Métriques
Voir les détails
ldc2016e25
Métriques
Voir les détails
math-lvl-5-4-shot
Métriques
Voir les détails
mmlu-5-shot
Métriques
Voir les détails
mmlu-pro-5-shot
Métriques
Voir les détails
mmlu-tr
Métriques
Voir les détails
mt-bench
Métriques
Voir les détails
mt-bench-jp
Métriques
Voir les détails
musr-0-shot
Métriques
Voir les détails
oab-exams
Métriques
Voir les détails
open-mindedness-0-shot
Métriques
Voir les détails
openwebtext
Métriques
Voir les détails
polcontro
Métriques
Voir les détails
pt-hate-speech-binary
Métriques
Voir les détails
sciq
Métriques
Voir les détails
stories-jokes
Métriques
Voir les détails
talking-0-shot
Métriques
Voir les détails
truthfulqa
Métriques
Voir les détails
truthfulqa-0-shot
Métriques
Voir les détails
truthfulqa-pt
Métriques
Voir les détails
truthfulqa-tr
Métriques
Voir les détails
tweetsentbr
Métriques
Voir les détails
unruly
Métriques
Voir les détails
w-10
Métriques
Voir les détails
wikitext-103
Métriques
Voir les détails
winogrande-5-shot
Métriques
Voir les détails
winogrande-tr
Métriques
Voir les détails
world-knowledge-0-shot
Métriques
Voir les détails