GEOMetrics: Die Nutzung geometrischer Strukturen für graphenkodierte Objekte

Mesh-Modelle sind ein vielversprechender Ansatz zur Kodierung der Struktur von 3D-Objekten. Aktuelle Mesh-Rekonstruktionsysteme prognostizieren durch eine Reihe von Graphenfaltungen gleichmäßig verteilte Knotenpositionen eines vorbestimmten Graphen, was zu Kompromissen in Bezug auf Leistung oder Auflösung führt. In dieser Arbeit argumentieren wir, dass die Graphendarstellung geometrischer Objekte zusätzliche Strukturen ermöglicht, die für eine verbesserte Rekonstruktion genutzt werden sollten. Daher schlagen wir ein System vor, das sich optimal von den Vorteilen der geometrischen Struktur von graphenkodierten Objekten nutzt, indem es (1) eine Graphenfaltungsberechnung einführt, die Knoteninformationen beibehält; (2) eine adaptive Aufspaltungsmethode ermöglicht, die Details hervortreten lässt; und (3) ein Trainingsziel definiert, das sowohl auf den durch Knoten definierten lokalen Oberflächen als auch auf der durch das Mesh definierten globalen Struktur operiert. Unsere vorgeschlagene Methode wird anhand der Aufgabe der 3D-Objektrekonstruktion aus Bildern mit dem ShapeNet-Datensatz evaluiert, wo wir sowohl visuell als auch numerisch den aktuellen Stand der Technik demonstrieren und dabei erheblich kleinere Speicheranforderungen haben, da sie adaptive Meshes generiert.