HyperAI

Natural Language Understanding On Dialoglue

Métriques

Average
Banking77 (Acc)
CLINC150 (Acc)
DSTC8 (F-1)
HWU64 (Acc)
MultiWOZ (Joint Goal Acc)
Restaurant8k (F-1)
TOP (EM)

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAverageBanking77 (Acc)CLINC150 (Acc)DSTC8 (F-1)HWU64 (Acc)MultiWOZ (Joint Goal Acc)Restaurant8k (F-1)TOP (EM)
Modèle 185.8391.1795.888.3391.3658.2294.8581.1
Modèle 286.8993.4492.3891.297.1156.5695.4482.08
Modèle 385.3492.9991.8286.4997.1158.2994.3476.36