HyperAI超神経

Robot Task Planning On Sheetcopilot

評価指標

Pass@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Pass@1
sheetagent-a-generalist-agent-for-spreadsheet61.1%
sheetcopilot-bringing-software-productivity44.3%