Command Palette
Search for a command to run...
FoldingNet: Autoencoder für Punktwolken durch tiefe Gitterverformung
FoldingNet: Autoencoder für Punktwolken durch tiefe Gitterverformung
Yang Yaoqing Feng Chen Shen Yiru Tian Dong
Zusammenfassung
Neuere tiefe Netzwerke, die direkt mit Punkten in einer Punktmenge umgehen, wie beispielsweise PointNet, stellen derzeit den Stand der Technik für überwachte Lernaufgaben auf Punktwolken wie Klassifikation und Segmentierung dar. In dieser Arbeit wird ein neuartiger end-to-end tiefer Autoencoder vorgestellt, um Herausforderungen des unüberwachten Lernens auf Punktwolken zu bewältigen. Auf der Encoder-Seite wird eine graphbasierte Erweiterung eingeführt, um lokale Strukturen über PointNet hinaus zu fördern. Anschließend wird ein neuartiger faltenbasierter Decoder vorgestellt, der ein kanonisches 2D-Gitter auf die zugrundeliegende 3D-Oberfläche eines Punktwolkenobjekts abbildet und selbst bei Objekten mit feinen Strukturen eine geringe Rekonstruktionsfehlerquote erreicht. Der vorgeschlagene Decoder verwendet lediglich etwa 7 % der Parameter eines Decoders mit vollständig verbundenen neuronalen Netzen, erzielt jedoch eine differenziertere Repräsentation, die eine höhere Klassifizierungsgenauigkeit bei linearen SVMs als die Benchmark ermöglicht. Zudem wird theoretisch gezeigt, dass die vorgeschlagene Decoder-Architektur eine generische Struktur darstellt, die in der Lage ist, eine beliebige Punktwolke aus einem 2D-Gitter zu rekonstruieren. Der Quellcode ist unter http://www.merl.com/research/license#FoldingNet verfügbar.