Math Word Problem Solving
Benchmark-Liste
Alle Benchmarks für diese Aufgabe
asdiv-a
Bestes Modell: ATHENA (roberta-large)
Metriken
Details anzeigen
gsm-plus
Bestes Modell: GPT-4
Metriken
Details anzeigen
math-minival
Bestes Modell: Process Supervision (GPT-4)
Metriken
Details anzeigen
math23k
Bestes Modell: Roberta-DeductReasoner
Metriken
Details anzeigen
mathqa
Bestes Modell: ELASTIC (RoBERTa-large)
Metriken
Details anzeigen
mawps
Bestes Modell: OpenMath-CodeLlama-70B (w/ code)
Metriken
Details anzeigen
paramawps
Bestes Modell: DeBERTa (VM)
Metriken
Details anzeigen
pen
Bestes Modell: EPT-X
Metriken
Details anzeigen
svamp
Bestes Modell: GPT-4 (Teaching-Inspired)
Metriken
Details anzeigen
svamp-1-n
Bestes Modell: ATHENA (roberta-large)
Metriken
Details anzeigen
alg514
Metriken
Details anzeigen
draw-1k
Metriken
Details anzeigen
math
Metriken
Details anzeigen