HyperAI超神经

Robot Task Planning On Sheetcopilot

评估指标

Pass@1

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称Pass@1
sheetagent-a-generalist-agent-for-spreadsheet61.1%
sheetcopilot-bringing-software-productivity44.3%