HyperAIHyperAI

Command Palette

Search for a command to run...

Modell- und Datenuntersuchungen für Bildfragenbeantwortung

Mengye Ren; Ryan Kiros; Richard Zemel

Zusammenfassung

Diese Arbeit befasst sich mit dem Problem des bildbasierten Frage-Antwortens (QA) durch die Einführung neuer Modelle und Datensätze. In unserem Beitrag schlagen wir vor, neuronale Netze und visuelle semantische Einbettungen zu verwenden, um Antworten auf einfache Fragen zu Bildern vorherzusagen, ohne dabei Zwischenschritte wie Objekterkennung und Bildsegmentierung zu nutzen. Unser Modell erzielt ein 1,8-fach besseres Ergebnis als das einzige bisher veröffentlichte Resultat auf einem bestehenden Bild-QA-Datensatz. Zudem stellen wir einen Algorithmus zur Fragegenerierung vor, der weit verbreitete Bildbeschreibungen in eine QA-Form umwandelt. Mit diesem Algorithmus haben wir einen Datensatz von einer Größenordnung größer erstellt, bei dem die Antworten gleichmäßiger verteilt sind. Eine Reihe von Baseline-Ergebnissen für diesen neuen Datensatz wird ebenfalls präsentiert.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Modell- und Datenuntersuchungen für Bildfragenbeantwortung | Paper | HyperAI