Answer Selection On Cicero
평가 지표
Exact Match
평가 결과
이 벤치마크에서 각 모델의 성능 결과
모델 이름 | Exact Match | Paper Title | Repository |
---|---|---|---|
T5-large | 77.68 | CICERO: A Dataset for Contextualized Commonsense Inference in Dialogues | |
Unified QA | 77.51 | CICERO: A Dataset for Contextualized Commonsense Inference in Dialogues |
0 of 2 row(s) selected.