Command Palette
Search for a command to run...
Rekurrente Modelle zur Situationserkennung
Rekurrente Modelle zur Situationserkennung
Mallya Arun Lazebnik Svetlana
Zusammenfassung
Diese Arbeit stellt rekurrente neuronale Netzwerke (RNNs) zur Vorhersage strukturierter „Bildsituationen“ vor – also von Aktionen und Nomen-Entitäten, die semantische Rollen im Zusammenhang mit der Aktion erfüllen. Im Gegensatz zu früheren Ansätzen, die auf bedingte zufällige Felder (CRFs) zurückgreifen, verwenden wir ein spezialisiertes Netzwerk zur Aktionsvorhersage, gefolgt von einem RNN zur Nomen-Vorhersage. Unser System erreicht auf dem anspruchsvollen jüngsten imSitu-Datensatz die bislang beste Genauigkeit und übertrifft CRF-basierte Modelle, einschließlich solcher, die mit zusätzlichen Daten trainiert wurden. Darüber hinaus zeigen wir, dass aus der Situationserkennung gelernte spezialisierte Merkmale auf die Aufgabe der Bildbeschreibung übertragen werden können, um mensch-objekt-Interaktionen präziser zu beschreiben.