Accueil Actualités Articles de recherche Tutoriels Ensembles de données Wiki SOTA Modèles LLM Classement GPU Événements

Français

Interactive Evaluation Of Dialog On Dstc9

Métriques

Coherent

Consistent

Diversity

Error Recovery

Flexible

Informative

Inquisitive

Likeable

Overall Human Rating

Topic Depth

Understanding

Résultats

Résultats de performance de divers modèles sur ce benchmark

Nom du modèle	Coherent	Consistent	Diversity	Error Recovery	Flexible	Informative	Inquisitive	Likeable	Overall Human Rating	Topic Depth	Understanding	Paper Title	Repository
PLATO-2	2.8017	0.9390	2.7441	2.7518	2.8000	2.7881	2.7949	2.7878	4.15	2.7678	2.8285	A Unified Pre-training Framework for Conversational AI

0 of 1 row(s) selected.