HyperAIHyperAI
vor 18 Tagen

Likert-Skala mit Gradentkopplung für die Bewertung langfristiger Aktionen

{Wei-Shi Zheng, Ling-An Zeng, Angchi Xu}
Likert-Skala mit Gradentkopplung für die Bewertung langfristiger Aktionen
Abstract

Die Bewertung der Langzeit-Aktionsqualität ist eine Aufgabe, die darauf abzielt, wie gut eine Aktion ausgeführt wird, genauer gesagt, die Schätzung einer Qualitätsbewertung anhand eines langen Videos. Intuitiv beinhalten Langzeitaktionen oft Teile mit unterschiedlichen Fähigkeitsniveaus, die wir als Leistungsgrade bezeichnen. Beispielsweise können in derselben Langzeitaktion technische Höhepunkte und Fehler auftreten. Daher sollte die endgültige Bewertung auf der Gesamtwirkung verschiedener Grade basieren, die im Video sichtbar werden. Um diese latente Beziehung zu erforschen, entwickeln wir ein neuartiges Likert-Bewertungsparadigma, das sich an der Likert-Skala der Psychometrie orientiert. Dabei quantifizieren wir die Grade explizit und erzeugen die endgültige Qualitätsbewertung durch Kombination der quantitativen Werte mit den jeweiligen Antworten, die aus dem Video geschätzt werden, anstatt eine direkte Regression durchzuführen. Zudem extrahieren wir grade-spezifische Merkmale, die zur Schätzung der Antworten jedes Grades verwendet werden, mittels einer Transformer-Decoder-Architektur mit diversen lernbaren Abfragen. Das gesamte Modell wird als Grade-decoupling Likert Transformer (GDLT) bezeichnet, und wir erzielen state-of-the-art-Ergebnisse auf zwei Datensätzen zur Langzeit-Aktionsbewertung.