Robot Task Planning On Sheetcopilot
評価指標
Pass@1
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Pass@1 |
---|---|
sheetagent-a-generalist-agent-for-spreadsheet | 61.1% |
sheetcopilot-bringing-software-productivity | 44.3% |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | Pass@1 |
---|---|
sheetagent-a-generalist-agent-for-spreadsheet | 61.1% |
sheetcopilot-bringing-software-productivity | 44.3% |