Response Generation On Simmc2 0
평가 지표
BLEU
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | BLEU |
---|---|
pace-unified-multi-modal-dialogue-pre | 34.1 |
learning-to-embed-multi-modal-contexts-for | 29.4 |
language-models-are-unsupervised-multitask | 19.2 |
learning-to-embed-multi-modal-contexts-for-1 | 33.1 |
multimodal-transformer-networks-for-end-to | 21.7 |