Dialogue State Tracking On Simmc2 0
평가 지표
Act F1
Slot F1
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Act F1 | Slot F1 |
---|---|---|
multimodal-transformer-networks-for-end-to | 93.4 | 76.7 |
learning-to-embed-multi-modal-contexts-for-1 | 95.2 | 82.0 |
language-models-are-unsupervised-multitask | 94.5 | 81.7 |
learning-to-embed-multi-modal-contexts-for-1 | 96.3 | 88.3 |
pace-unified-multi-modal-dialogue-pre | 97.1 | 87.0 |