Question Answering On Casehold

評価指標

Macro F1 (10-fold)

評価結果

このベンチマークにおける各モデルのパフォーマンス結果