Robot Task Planning On Sheetcopilot
评估指标
Pass@1
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | Pass@1 |
---|---|
sheetagent-a-generalist-agent-for-spreadsheet | 61.1% |
sheetcopilot-bringing-software-productivity | 44.3% |
各个模型在此基准测试上的表现结果
模型名称 | Pass@1 |
---|---|
sheetagent-a-generalist-agent-for-spreadsheet | 61.1% |
sheetcopilot-bringing-software-productivity | 44.3% |