HyperAIHyperAI

Command Palette

Search for a command to run...

Lernen von Was und Wo: Trennung der Ortungs- und Identitätsspur ohne Aufsicht

Manuel Traub Sebastian Otte Tobias Menge Matthias Karlbauer Jannik Thümmel Martin V. Butz

Zusammenfassung

Unser Gehirn kann visuelle Datenströme fast ohne Anstrengung in Hintergrund und auffällige Objekte zerlegen. Darüber hinaus kann es die Bewegung und Interaktionen von Objekten voraussagen, Fähigkeiten, die für konzeptionelles Planen und Denken entscheidend sind. Kürzlich veröffentlichte Datensätze zur Objektbegründung, wie CATER, haben fundamentale Mängel der aktuellen visionären KI-Systeme aufgezeigt, insbesondere bei der Erstellung expliziter Objektrepräsentationen, der Objektpermanenz und dem objektorientierten Denken. Hier stellen wir ein selbstüberwachtes System zur Verfolgung von Lage und Identität (Loci) vor, das sich im CATER-Tracking-Challenge hervortut. Inspiriert durch die dorsale und ventrale Pfade im Gehirn löst Loci das Bindungsproblem durch die separate, schlitzenweise Kodierung von "was" und "wo". Die prädiktionskodierungsähnliche Verarbeitung von Loci fördert eine aktive Fehlerminimierung, so dass einzelne Schlitze dazu neigen, einzelne Objekte zu kodieren. Interaktionen zwischen Objekten und Objektdynamiken werden im entkoppelten latenten Raum verarbeitet. Abgeschnittene Rückpropagation durch die Zeit in Kombination mit Vorwärtsakkumulation der Eligibilität beschleunigt das Lernen erheblich und verbessert die Speichereffizienz. Neben der Überlegenheit in aktuellen Benchmarks extrahiert Loci effektiv Objekte aus Videostreams und trennt sie in Lage- und Gestaltkomponenten. Wir glauben, dass diese Trennung eine Repräsentation bietet, die effektives Planen und Denken auf konzeptueller Ebene erleichtern wird.注释:- "Gestalt" 是德语中的一个术语,常用于心理学和视觉科学中,表示“形状”或“整体形式”。在这里直接使用德语词汇以保持专业性和准确性。


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp