HyperAIHyperAI
vor 2 Monaten

Lernen von Was und Wo: Trennung der Ortungs- und Identitätsspur ohne Aufsicht

Manuel Traub; Sebastian Otte; Tobias Menge; Matthias Karlbauer; Jannik Thümmel; Martin V. Butz
Lernen von Was und Wo: Trennung der Ortungs- und Identitätsspur ohne Aufsicht
Abstract

Unser Gehirn kann visuelle Datenströme fast ohne Anstrengung in Hintergrund und auffällige Objekte zerlegen. Darüber hinaus kann es die Bewegung und Interaktionen von Objekten voraussagen, Fähigkeiten, die für konzeptionelles Planen und Denken entscheidend sind. Kürzlich veröffentlichte Datensätze zur Objektbegründung, wie CATER, haben fundamentale Mängel der aktuellen visionären KI-Systeme aufgezeigt, insbesondere bei der Erstellung expliziter Objektrepräsentationen, der Objektpermanenz und dem objektorientierten Denken. Hier stellen wir ein selbstüberwachtes System zur Verfolgung von Lage und Identität (Loci) vor, das sich im CATER-Tracking-Challenge hervortut. Inspiriert durch die dorsale und ventrale Pfade im Gehirn löst Loci das Bindungsproblem durch die separate, schlitzenweise Kodierung von "was" und "wo". Die prädiktionskodierungsähnliche Verarbeitung von Loci fördert eine aktive Fehlerminimierung, so dass einzelne Schlitze dazu neigen, einzelne Objekte zu kodieren. Interaktionen zwischen Objekten und Objektdynamiken werden im entkoppelten latenten Raum verarbeitet. Abgeschnittene Rückpropagation durch die Zeit in Kombination mit Vorwärtsakkumulation der Eligibilität beschleunigt das Lernen erheblich und verbessert die Speichereffizienz. Neben der Überlegenheit in aktuellen Benchmarks extrahiert Loci effektiv Objekte aus Videostreams und trennt sie in Lage- und Gestaltkomponenten. Wir glauben, dass diese Trennung eine Repräsentation bietet, die effektives Planen und Denken auf konzeptueller Ebene erleichtern wird.注释:- "Gestalt" 是德语中的一个术语,常用于心理学和视觉科学中,表示“形状”或“整体形式”。在这里直接使用德语词汇以保持专业性和准确性。

Lernen von Was und Wo: Trennung der Ortungs- und Identitätsspur ohne Aufsicht | Neueste Forschungsarbeiten | HyperAI