Question Answering On Quac
평가 지표
F1
평가 결과
이 벤치마크에서 각 모델의 성능 결과
모델 이름 | F1 | Paper Title | Repository |
---|---|---|---|
GPT-3 175B (few-shot, k=32) | 44.3 | Language Models are Few-Shot Learners | |
FlowQA (single model) | 64.1 | FlowQA: Grasping Flow in History for Conversational Machine Comprehension |
0 of 2 row(s) selected.