Question Answering On Quac

評価指標

F1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
F1
Paper TitleRepository
GPT-3 175B (few-shot, k=32)44.3Language Models are Few-Shot Learners-
FlowQA (single model)64.1FlowQA: Grasping Flow in History for Conversational Machine Comprehension-
0 of 2 row(s) selected.