HyperAIHyperAI

Command Palette

Search for a command to run...

このベンチマークにおける各種モデルの性能結果

メトリクス

Succ. Rate (12 tasks, 100 demo/task)
Succ. Rate (12 tasks, 1000 demo/task)
Succ. Rate (12 tasks, 200 demo/task)
6 合計