HyperAIHyperAI

Visuelle Alltagsverstandstests

Die Visual Commonsense Tests sind eine Unterabgabe im Bereich der Natürlichen Sprachverarbeitung, die darauf abzielt, das Verständnis des Modells für Alltagswissen in visuellen Szenen zu bewerten. Diese Aufgabe wird durch die Vorhersage von fünf Arten von Attributen (Farbe, Form, Material, Größe und visuelle Ko-Existenz) für über 5.000 Objekte erfüllt. Das Ziel ist es, die Fähigkeiten des Modells in Bezug auf Schlussfolgerungen und Urteilsbildung in komplexen visuellen Umgebungen zu verbessern sowie seine Robustheit und Generalisierungsfähigkeit in realen Anwendungen zu erhöhen.

Visuelle Alltagsverstandstests | SOTA | HyperAI