Bildbedingte Graphgenerierung für die Extraktion von Straßennetzen

Tiefen generative Modelle für Graphen haben großes Versprechen im Bereich der Arzneimittelentwicklung gezeigt, fanden jedoch bisher kaum Anwendung jenseits der Generierung graphstrukturierter Moleküle. In dieser Arbeit präsentieren wir einen Proof-of-Concept für die anspruchsvolle Aufgabe der Extraktion von Straßennetzwerken aus Bilddaten. Diese Aufgabe lässt sich als graphenbasierte Generierung unter Bildbedingung formulieren, für die wir den Generative Graph Transformer (GGT) entwickeln – ein tiefes autoregressives Modell, das Aufmerksamkeitsmechanismen zur Bildbedingung und die rekursive Generierung von Graphen nutzt. Wir evaluieren den GGT anhand der Anwendung der Straßennetzextraktion aus semantischen Segmentierungsdaten. Dazu stellen wir den Toulouse Road Network-Datensatz vor, der auf realen, öffentlich verfügbaren Daten basiert. Zudem führen wir die StreetMover-Distanz ein: eine Metrik, die auf der Sinkhorn-Distanz basiert und effektiv zur Bewertung der Qualität der Straßennetzgenerierung eingesetzt werden kann. Der Quellcode und der Datensatz sind öffentlich zugänglich.