Einen hierarchischen latente-Variable-Modell von 3D-Formen erlernen

Wir schlagen den Variational Shape Learner (VSL) vor, ein generatives Modell, das die zugrunde liegende Struktur von vekselisierten 3D-Formen auf unsupervisierte Weise lernt. Durch die Verwendung von Skip-Verbindungen kann unser Modell erfolgreich eine latente, hierarchische Darstellung von Objekten lernen und inferieren. Zudem können realistische 3D-Objekte durch das Abtasten des latenten probabilistischen Manifolds des VSL leicht generiert werden. Wir zeigen, dass unser generatives Modell von 2D-Bildern aus end-to-end trainiert werden kann, um die 3D-Modellretrieval aus einem einzelnen Bild durchzuführen. Experimente belegen sowohl quantitativ als auch qualitativ die verbesserte Generalisierungsfähigkeit unseres vorgeschlagenen Modells bei einer Reihe von Aufgaben, wobei es besser oder vergleichbar mit verschiedenen Stand der Technik Alternativen abschneidet.