HyperAI超神経

Video Question Answering On Dramaqa

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
large-language-models-are-temporal-and-causal84.1