Video Based Generative Performance 1
Video-basierte Generative Performance-Benchmarking (Richtigkeit der Informationen) ist eine Bewertungsmethode zur Überprüfung der Informationsgenauigkeit von generativen Video-Dialogmodellen. Diese Aufgabe basiert auf dem ActivityNet-200-Datensatz und erstellt einen Testdatensatz mit reichhaltigen und dichten beschreibenden Bildunterschriften sowie menschlich annotierten Frage-Antwort-Paaren. Das mit dem GPT-3.5-Modell entwickelte Evaluierungsframework weist den generierten Vorhersagen eine relative Bewertung von 1 bis 5 zu, um die Informationsrichtigkeit in Video-Dialogen zu quantifizieren und eine wissenschaftliche Grundlage für Modelloptimierung und Leistungsverbesserung bereitzustellen.