HyperAIHyperAI

Command Palette

Search for a command to run...

Rekurrente Modelle zur Situationserkennung

Mallya Arun Lazebnik Svetlana

Zusammenfassung

Diese Arbeit stellt rekurrente neuronale Netzwerke (RNNs) zur Vorhersage strukturierter „Bildsituationen“ vor – also von Aktionen und Nomen-Entitäten, die semantische Rollen im Zusammenhang mit der Aktion erfüllen. Im Gegensatz zu früheren Ansätzen, die auf bedingte zufällige Felder (CRFs) zurückgreifen, verwenden wir ein spezialisiertes Netzwerk zur Aktionsvorhersage, gefolgt von einem RNN zur Nomen-Vorhersage. Unser System erreicht auf dem anspruchsvollen jüngsten imSitu-Datensatz die bislang beste Genauigkeit und übertrifft CRF-basierte Modelle, einschließlich solcher, die mit zusätzlichen Daten trainiert wurden. Darüber hinaus zeigen wir, dass aus der Situationserkennung gelernte spezialisierte Merkmale auf die Aufgabe der Bildbeschreibung übertragen werden können, um mensch-objekt-Interaktionen präziser zu beschreiben.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Rekurrente Modelle zur Situationserkennung | Paper | HyperAI