vor 8 Monaten

Zusammenfassung

Tiefe neuronale Netze können Bilder mit reichhaltigen latente Darstellungen modellieren, aber sie können Strukturen von Objektkategorien nicht auf natürliche Weise im menschlichen Wahrnehmungsbereich konzeptualisieren. Dieses Papier behandelt das Problem des Lernens von Objektstrukturen in einem Bildmodellierungsprozess ohne Aufsicht. Wir schlagen eine Autoencoding-Formulierung vor, um Landmarks als explizite strukturelle Darstellungen zu entdecken. Das Codierungsmodul gibt Landmark-Koordinaten aus, deren Gültigkeit durch Einschränkungen sichergestellt wird, die die notwendigen Eigenschaften für Landmarks widerspiegeln. Das Decodierungsmodul nimmt die Landmarks als Teil der lernfähigen Eingabedarstellungen in einem end-to-end differenzierbaren Framework auf. Unsere entdeckten Landmarks sind semantisch bedeutsam und prädiktiver für manuell annotierte Landmarks als jene, die durch frühere Methoden gefunden wurden. Die Koordinaten unserer Landmarks sind auch ergänzende Merkmale zu vortrainierten tiefen neuronalen Netz-Darstellungen bei der Erkennung visueller Attribute. Zudem erstellt die vorgeschlagene Methode natürlich ein unüberwachtes, wahrnehmbares Interface zur Manipulation von Objektformen und zum Decodieren von Bildern mit steuerbaren Strukturen. Die Projektwebseite ist unter http://ytzhang.net/projects/lmdis-rep zu finden.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Computer Vision

Faltungsneuronales Netzwerk

Yuting Zhang Yijie Guo Yixin Jin Yijun Luo Zhiyuan He Honglak Lee

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Computer Vision

Faltungsneuronales Netzwerk

Yuting Zhang Yijie Guo Yixin Jin Yijun Luo Zhiyuan He Honglak Lee

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Unüberwachte Entdeckung von Objekt-Landmarken als strukturelle Repräsentationen

Yuting Zhang Yijie Guo Yixin Jin Yijun Luo Zhiyuan He Honglak Lee

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Unüberwachte Entdeckung von Objekt-Landmarken als strukturelle Repräsentationen

Yuting Zhang Yijie Guo Yixin Jin Yijun Luo Zhiyuan He Honglak Lee

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Unüberwachte Entdeckung von Objekt-Landmarken als strukturelle Repräsentationen

Yuting Zhang Yijie Guo Yixin Jin Yijun Luo Zhiyuan He Honglak Lee

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters