HyperAIHyperAI

Command Palette

Search for a command to run...

Einfache Baseline für visuelle Fragebeantwortung

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Zusammenfassung

Wir beschreiben eine sehr einfache Bag-of-Words-Baseline für visuelle Fragebeantwortung. Diese Baseline verbindet die Wortmerkmale aus der Frage mit den CNN-Merkmalen aus dem Bild, um die Antwort vorherzusagen. Bei der Auswertung am anspruchsvollen VQA-Datensatz [2] zeigt sie eine vergleichbare Leistung vieler neuer Ansätze, die rekurrente Neuronale Netze verwenden. Um die Stärken und Schwächen des trainierten Modells zu erforschen, stellen wir zudem eine interaktive Web-Demo sowie Open-Source-Code bereit.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp