HyperAIHyperAI

Command Palette

Search for a command to run...

Unüberwachte Mehrgegenständerkennung unter Verwendung von Aufmerksamkeit und Soft-argmax

Bruno Sauvalle; Arnaud de La Fortelle

Zusammenfassung

Wir stellen eine neue Architektur für die unüberwachte objektorientierte Darstellungslernung und die Erkennung und Segmentierung mehrerer Objekte vor. Diese Architektur verwendet einen translationsäquivarianten Aufmerksamkeitsmechanismus, um die Koordinaten der in der Szene vorhandenen Objekte vorherzusagen und jedem Objekt einen Merkmalsvektor zuzuordnen. Ein Transformer-Encoder behandelt Verdeckungen und redundante Erkennungen, während ein konvolutionsbasierter Autoencoder für die Rekonstruktion des Hintergrunds verantwortlich ist. Wir zeigen, dass diese Architektur auf komplexen synthetischen Benchmarks den aktuellen Stand der Technik erheblich übertrifft.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp