HyperAI超神経

Multimodal Reasoning On Algopuzzlevqa

評価指標

Acc

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Acc
are-language-models-puzzle-prodigies30.3