Robot Task Planning On Sheetcopilot
Métriques
Pass@1
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Pass@1 |
---|---|
sheetagent-a-generalist-agent-for-spreadsheet | 61.1% |
sheetcopilot-bringing-software-productivity | 44.3% |