Search for a command to run...
FrontierMath: Ein Benchmark zur Bewertung fortgeschrittener mathematischer Schlussfolgerungsfähigkeiten in KI