HyperAI超神経

Natural Language Understanding On Dialoglue

評価指標

Average
Banking77 (Acc)
CLINC150 (Acc)
DSTC8 (F-1)
HWU64 (Acc)
MultiWOZ (Joint Goal Acc)
Restaurant8k (F-1)
TOP (EM)

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名AverageBanking77 (Acc)CLINC150 (Acc)DSTC8 (F-1)HWU64 (Acc)MultiWOZ (Joint Goal Acc)Restaurant8k (F-1)TOP (EM)
モデル 185.8391.1795.888.3391.3658.2294.8581.1
モデル 286.8993.4492.3891.297.1156.5695.4482.08
モデル 385.3492.9991.8286.4997.1158.2994.3476.36