HyperAI

Natural Language Understanding On Dialoglue 1

Métriques

Average
Banking77 (Acc)
CLINC150 (Acc)
DSTC8 (F-1)
HWU64 (Acc)
MultiWOZ (Joint Goal Acc)
Restaurant8k (F-1)
TOP (EM)

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAverageBanking77 (Acc)CLINC150 (Acc)DSTC8 (F-1)HWU64 (Acc)MultiWOZ (Joint Goal Acc)Restaurant8k (F-1)TOP (EM)
Modèle 168.2283.9984.5248.492.756.8786.1778.84
Modèle 273.885.0685.6944.3693.0648.8987.5872.01
Modèle 339.1688.9995.640.089.50.00.00.0
Modèle 474.684.8493.5346.6386.7149.5987.3373.56
Modèle 573.4978.4788.9856.8882.5149.4685.3172.84