HyperAIHyperAI
vor 2 Monaten

Point2Sequence: Lernen der Formrepräsentation von 3D-Punktwolken mit einem aufmerksamkeitsbasierten Sequenz-zu-Sequenz-Netzwerk

Xinhai Liu; Zhizhong Han; Yu-Shen Liu; Matthias Zwicker
Point2Sequence: Lernen der Formrepräsentation von 3D-Punktwolken mit einem aufmerksamkeitsbasierten Sequenz-zu-Sequenz-Netzwerk
Abstract

Die Exploration kontextueller Informationen in der lokalen Region ist für die Formverstehens- und -analyse von Bedeutung. Bestehende Studien verwenden häufig manuell gestaltete oder explizite Methoden, um kontextuelle Informationen lokaler Regionen zu kodieren. Es ist jedoch schwierig, feingranulare kontextuelle Informationen auf diese Weise zu erfassen, wie beispielsweise die Korrelation zwischen verschiedenen Bereichen in einer lokalen Region, was die Diskriminierungsfähigkeit der gelernten Merkmale einschränkt. Um dieses Problem zu lösen, schlagen wir ein neues tiefes Lernmodell für 3D-Punktwolken vor, das Point2Sequence genannt wird. Dieses Modell lernt 3D-Formmerkmale, indem es feingranulare kontextuelle Informationen auf eine neue implizite Art erfasst. Point2Sequence verwendet ein neuartiges sequenzielles Lernmodell für Punktwolken, um durch Aggregation von mehrskaligen Bereichen jeder lokalen Region mit Aufmerksamkeit die Korrelationen zu erfassen. Genauer gesagt lernt Point2Sequence zunächst das Merkmal jeder Skala in einer lokalen Region. Anschließend fängt es im Prozess der Aggregation aller Skalen mittels einer auf einem rekurrenten neuronalen Netzwerk (RNN) basierenden Encoder-Decoder-Struktur die Korrelation zwischen den Skalen ein. Dabei wird ein Aufmerksamkeitsmechanismus vorgeschlagen, um die Bedeutung verschiedener Skalen hervorzuheben. Experimentelle Ergebnisse zeigen, dass Point2Sequence den Stand der Technik in Formklassifikations- und -segmentierungsaufgaben erreicht.