HyperAI超神経

Multi Agent Integration On Bbai Dataset

評価指標

P@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名P@1
one-agent-to-rule-them-all-towards-multi-183.55