HyperAI超神経

Robot Task Planning On Sheetcopilot

評価指標

Pass@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

0 of 2 row(s) selected.