HyperAI

Question Answering On Casehold

Metriken

Macro F1 (10-fold)

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameMacro F1 (10-fold)
when-does-pretraining-help-assessing-self61.3
when-does-pretraining-help-assessing-self68.0
when-does-pretraining-help-assessing-self69.5