HyperAI

Mathematical Reasoning On Math500

Metriken

Acc

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAcc
search-o1-agentic-search-enhanced-large86.4