CGA-Net: Category Guided Aggregation für die Semantische Segmentierung von Punktwolken

Frühere Netzwerke für die semantische Segmentierung von Punktwolken verwenden den gleichen Aggregationsprozess, um Merkmale von Nachbarn derselben Kategorie und unterschiedlicher Kategorien zu kombinieren. Allerdings nimmt der gemeinsame Bereich zweier Objekte in der Regel nur einen geringen Anteil am gesamten Szenenraum ein. Daher sind die Netzwerke gut darauf trainiert, Merkmale von Nachbarn derselben Kategorie zu aggregieren, jedoch nicht ausreichend auf die Aggregation von Nachbarn unterschiedlicher Kategorien trainiert. Um dieses Problem anzugehen, schlägt dieser Artikel vor, unterschiedliche Aggregationsstrategien für Nachbarn derselben und unterschiedlicher Kategorien einzusetzen. Konkret wird ein maßgeschneidertes Modul vorgestellt, das als kategoriengesteuerte Aggregation (Category Guided Aggregation, CGA) bezeichnet wird. Zunächst erkennt dieses Modul, ob die Nachbarn zur selben Kategorie wie der zentrale Punkt gehören oder nicht, und behandelt die beiden Nachbarentypen anschließend mit zwei sorgfältig entworfenen Modulen. Das vorgeschlagene CGA-Modul ist allgemein einsetzbar und kann in beliebige bestehende Netzwerke für semantische Segmentierung integriert werden. Experimente an drei unterschiedlichen Backbone-Architekturen belegen die Wirksamkeit des vorgeschlagenen Ansatzes.