HyperAI

Robot Task Planning On Sheetcopilot

Métriques

Pass@1

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèlePass@1
sheetagent-a-generalist-agent-for-spreadsheet61.1%
sheetcopilot-bringing-software-productivity44.3%