HyperAIHyperAI

Command Palette

Search for a command to run...

Roboter erstellen schnell präzise 3D-Karten aus beliebig vielen Bildern

Ein Roboter, der nach Menschen in einem teilweise eingestürzten Bergwerk sucht, muss innerhalb von Sekunden eine genaue Karte der Umgebung erstellen und seine Position darin bestimmen, während er sich durch gefährliches Gelände bewegt. Bisherige KI-Modelle zur Erstellung von 3D-Karten aus Kamerasignalen sind jedoch auf wenige Bilder beschränkt und eignen sich daher nicht für große, dynamische Szenen. Forscher vom MIT haben nun ein neues System entwickelt, das beliebig viele Bilder verarbeiten kann, indem es die Umgebung in kleinere Teilkarten zerlegt, diese inkrementell aufbaut und anschließend zu einer vollständigen 3D-Rekonstruktion zusammensetzt. Dabei schätzt das System gleichzeitig die Position des Roboters in Echtzeit. Im Gegensatz zu herkömmlichen Ansätzen benötigt das Verfahren keine kalibrierten Kameras oder aufwändige Einstellungen durch Experten. Die Methode kombiniert moderne maschinelle Lernverfahren mit klassischen Techniken der Computer Vision, um Verzerrungen in den Teilkarten zu korrigieren, die durch neuronale Netzwerke entstehen können. Durch mathematische Transformationen werden diese Verzerrungen konsistent behandelt, sodass die Teilkarten präzise zusammengefügt werden können. Die Ergebnisse zeigen eine mittlere Fehlerquote von weniger als fünf Zentimetern bei der Rekonstruktion komplexer Szenen wie des MIT-Chapels – und das innerhalb von Sekunden, basierend auf Aufnahmen von einem Smartphone. Das System ist schnell, genau und einfach zu implementieren, was es ideal für den Einsatz in Such- und Rettungsrobotern, aber auch in Erweiterter Realität (XR) für VR-Brillen oder industriellen Automatisierungslösungen macht. Der Hauptautor Dominic Maggio und seine Kollegen Hyungtae Lim sowie Luca Carlone präsentierten ihre Arbeit auf der NeurIPS-Konferenz. Carlone betont, dass das Verständnis klassischer geometrischer Prinzipien entscheidend für die Verbesserung moderner KI-Systeme sei. Die Forschung wird unter anderem von der US-National Science Foundation, dem Office of Naval Research und der National Research Foundation of Korea gefördert. Carlone, der aktuell als Amazon Scholar tätig ist, hat die Arbeit vor seinem Wechsel zu Amazon abgeschlossen. Die Methode stellt einen bedeutenden Fortschritt in der Robotik dar, da sie die Grenzen von bisherigen KI-basierten SLAM-Systemen überwindet. Experten schätzen die Arbeit als wegweisend ein: „Dies ist eine elegante Lösung, die den Vorteil von Lernansätzen mit der Robustheit klassischer Methoden verbindet“, sagt ein unabhängiger Forscher aus dem Bereich autonome Systeme. Die einfache Handhabung und hohe Genauigkeit machen das System besonders geeignet für den Einsatz in kritischen, zeitkritischen Szenarien. MITs SPARK-Labor, das Carlone leitet, ist führend in der Entwicklung von intelligenten, autonomen Systemen, die in der Praxis einsetzbar sind. Die Technologie könnte künftig nicht nur in der Rettungsdienst- und Katastrophenhilfe, sondern auch in der Logistik, im Smart-Factory-Bereich und in der personalisierten Technologie für den Alltag Anwendung finden.

Verwandte Links