HyperAI超神経

Natural Language Understanding On Dialoglue 1

評価指標

Average
Banking77 (Acc)
CLINC150 (Acc)
DSTC8 (F-1)
HWU64 (Acc)
MultiWOZ (Joint Goal Acc)
Restaurant8k (F-1)
TOP (EM)

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名AverageBanking77 (Acc)CLINC150 (Acc)DSTC8 (F-1)HWU64 (Acc)MultiWOZ (Joint Goal Acc)Restaurant8k (F-1)TOP (EM)
モデル 168.2283.9984.5248.492.756.8786.1778.84
モデル 273.885.0685.6944.3693.0648.8987.5872.01
モデル 339.1688.9995.640.089.50.00.00.0
モデル 474.684.8493.5346.6386.7149.5987.3373.56
モデル 573.4978.4788.9856.8882.5149.4685.3172.84