HyperAIHyperAI

Command Palette

Search for a command to run...

Training für Vielfalt in der Bild-Paragraph-Kommentierung

George Han er Luke Melas-Kyriazi Alex Rush

Zusammenfassung

Bildabsatz-Kommentarmodelle zielen darauf ab, detaillierte Beschreibungen eines Quellbildes zu generieren. Diese Modelle nutzen ähnliche Techniken wie herkömmliche Bildkommentarmodelle, stoßen jedoch bei der Textgenerierung auf Probleme, insbesondere auf mangelnde Vielfalt zwischen Sätzen, was ihre Wirksamkeit einschränkt. In dieser Arbeit untersuchen wir den Einsatz von sequenzbasiertem Training für diese Aufgabe. Wir stellen fest, dass das herkömmliche selbstkritische Training schlechte Ergebnisse liefert, jedoch erheblich bessere Ergebnisse erzielt, wenn es mit einem integrierten Strafterm für Trigramm-Wiederholungen kombiniert wird. Dieser einfache Trainingsansatz verbessert das bisher beste Ergebnis auf dem Visual Genome-Absatz-Kommentar-Datensatz von 16,9 auf 30,6 CIDEr und zeigt zudem Verbesserungen bei METEOR und BLEU, ohne dass Änderungen an der Architektur erforderlich sind.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp