HyperAIHyperAI

Command Palette

Search for a command to run...

Keine Metriken sind perfekt: Widersprüchliches Belohnungslernen für visuelle Geschichtenerzählung

Xin Wang* Wenhui Chen* Yuan-Fang Wang William Yang Wang

Zusammenfassung

Obwohl beeindruckende Ergebnisse im Bereich der visuellen Bildunterschriften erzielt wurden, bleibt die Aufgabe, aus Fotoströmen abstrakte Geschichten zu generieren, ein wenig untersuchtes Problem. Im Gegensatz zu Bildunterschriften haben Geschichten expressivere Sprachstile und enthalten viele imaginäre Konzepte, die nicht in den Bildern erscheinen. Dies stellt Herausforderungen für Verhaltensklonierungsalgorithmen dar. Zudem führen die Einschränkungen automatisierter Metriken bei der Bewertung der Story-Qualität dazu, dass Reinforcement-Learning-Methoden mit manuell gestalteten Belohnungen Schwierigkeiten haben, einen allgemeinen Leistungsanstieg zu erzielen. Daher schlagen wir ein Framework des adversariellen Belohnungslernens (Adversarial REward Learning, AREL) vor, um eine implizite Belohnungsfunktion aus menschlichen Demonstrationen zu lernen und dann die Policysuche mit der gelernten Belohnungsfunktion zu optimieren. Obwohl automatische Evaluierungen einen leichten Leistungsanstieg im Vergleich zu den Stand-of-the-Art-Methoden (SOTA) bei der Klonierung von Expertenverhalten anzeigen, zeigt eine menschliche Bewertung, dass unser Ansatz signifikante Verbesserungen bei der Generierung menschenähnlicher Geschichten gegenüber SOTA-Systemen erreicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Keine Metriken sind perfekt: Widersprüchliches Belohnungslernen für visuelle Geschichtenerzählung | Paper | HyperAI