HyperAI

Robot Task Planning On Sheetcopilot

Metriken

Pass@1

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnamePass@1
sheetagent-a-generalist-agent-for-spreadsheet61.1%
sheetcopilot-bringing-software-productivity44.3%