HyperAI

Question Answering On Casehold

Métriques

Macro F1 (10-fold)

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleMacro F1 (10-fold)
when-does-pretraining-help-assessing-self61.3
when-does-pretraining-help-assessing-self68.0
when-does-pretraining-help-assessing-self69.5