vor 7 Monaten

Zusammenfassung

Wir beschreiben eine sehr einfache Bag-of-Words-Baseline für visuelle Fragebeantwortung. Diese Baseline verbindet die Wortmerkmale aus der Frage mit den CNN-Merkmalen aus dem Bild, um die Antwort vorherzusagen. Bei der Auswertung am anspruchsvollen VQA-Datensatz [2] zeigt sie eine vergleichbare Leistung vieler neuer Ansätze, die rekurrente Neuronale Netze verwenden. Um die Stärken und Schwächen des trainierten Modells zu erforschen, stellen wir zudem eine interaktive Web-Demo sowie Open-Source-Code bereit.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Visuelle Fragebeantwortung

Multimodal

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Multimodal

Aufgabe

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Einfache Baseline für visuelle Fragebeantwortung

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Einfache Baseline für visuelle Fragebeantwortung

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Einfache Baseline für visuelle Fragebeantwortung

Bolei Zhou; Yuandong Tian; Sainbayar Sukhbaatar; Arthur Szlam; Rob Fergus

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters