HyperAI초신경

Natural Language Understanding On Dialoglue

평가 지표

Average
Banking77 (Acc)
CLINC150 (Acc)
DSTC8 (F-1)
HWU64 (Acc)
MultiWOZ (Joint Goal Acc)
Restaurant8k (F-1)
TOP (EM)

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름AverageBanking77 (Acc)CLINC150 (Acc)DSTC8 (F-1)HWU64 (Acc)MultiWOZ (Joint Goal Acc)Restaurant8k (F-1)TOP (EM)
모델 185.8391.1795.888.3391.3658.2294.8581.1
모델 286.8993.4492.3891.297.1156.5695.4482.08
모델 385.3492.9991.8286.4997.1158.2994.3476.36