HyperAI

Video Question Answering On Dramaqa

Metriken

Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAccuracy
large-language-models-are-temporal-and-causal84.1