HyperAIHyperAI
vor 2 Monaten

Ein Leseschreib-Gedächtnisnetzwerk für das Verstehen von Filmgeschichten

Seil Na; Sangho Lee; Jisung Kim; Gunhee Kim
Ein Leseschreib-Gedächtnisnetzwerk für das Verstehen von Filmgeschichten
Abstract

Wir schlagen ein neues Modell des Gedächtnisnetzes vor, das als Read-Write Memory Network (RWMN) bezeichnet wird, um Frage-Antwort-Aufgaben für die großmaßstäbliche, multimodale Verständnis von Filmmärchen zu bearbeiten. Der zentrale Schwerpunkt unseres RWMN-Modells liegt auf der Gestaltung des Lese- und Schreibnetzes, die aus mehreren Faltungsschichten bestehen. Dies ermöglicht es Operationen des Lesens und Schreibens im Gedächtnis eine hohe Kapazität und Flexibilität zu erlangen. Während existierende modellgestützte Gedächtnisnetze jedes Gedächtnisfeld als unabhängigen Block behandeln, ermöglicht uns die Verwendung mehrschichtiger CNNs (Convolutional Neural Networks), dass das Modell sequentielle Gedächtniszellen in Blöcken liest und schreibt. Dies ist eine realistischere Darstellung einer sequentiellen Geschichte, da benachbarte Gedächtnisblöcke oft starke Korrelationen aufweisen. Für die Bewertung wenden wir unser Modell auf alle sechs Aufgaben der MovieQA-Benchmark an und erreichen die besten Genauigkeiten bei mehreren Aufgaben, insbesondere bei der visuellen QA-Aufgabe. Unser Modell zeigt ein Potenzial, nicht nur den Inhalt der Geschichte besser zu verstehen, sondern auch abstraktere Informationen wie Beziehungen zwischen Charakteren und Gründe für ihre Handlungen.请注意,虽然您的要求中提到“使其更符合法语读者的阅读习惯”,但根据上下文,您需要的是德语翻译。因此,我已按照德语的标准进行了翻译。如果您有任何其他需求,请随时告知。

Ein Leseschreib-Gedächtnisnetzwerk für das Verstehen von Filmgeschichten | Neueste Forschungsarbeiten | HyperAI