HyperAI超神経

Multimodal Reasoning On Rebus

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
rebus-a-robust-evaluation-benchmark-of-10.6
rebus-a-robust-evaluation-benchmark-of-10.9
rebus-a-robust-evaluation-benchmark-of-10.9
rebus-a-robust-evaluation-benchmark-of-11.8
rebus-a-robust-evaluation-benchmark-of-113.2
rebus-a-robust-evaluation-benchmark-of-11.5
rebus-a-robust-evaluation-benchmark-of-10.9
rebus-a-robust-evaluation-benchmark-of-124.0