HyperAI초신경

Natural Language Understanding On Dialoglue 1

평가 지표

Average
Banking77 (Acc)
CLINC150 (Acc)
DSTC8 (F-1)
HWU64 (Acc)
MultiWOZ (Joint Goal Acc)
Restaurant8k (F-1)
TOP (EM)

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름AverageBanking77 (Acc)CLINC150 (Acc)DSTC8 (F-1)HWU64 (Acc)MultiWOZ (Joint Goal Acc)Restaurant8k (F-1)TOP (EM)
모델 168.2283.9984.5248.492.756.8786.1778.84
모델 273.885.0685.6944.3693.0648.8987.5872.01
모델 339.1688.9995.640.089.50.00.00.0
모델 474.684.8493.5346.6386.7149.5987.3373.56
모델 573.4978.4788.9856.8882.5149.4685.3172.84