HyperAI超神経

Question Answering On Casehold

評価指標

Macro F1 (10-fold)

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Macro F1 (10-fold)
when-does-pretraining-help-assessing-self61.3
when-does-pretraining-help-assessing-self68.0
when-does-pretraining-help-assessing-self69.5