Monokulare 3D-Objekterkennung: Ein ansatzfreier Ansatz für extrinsische Parameter

Die monokulare 3D-Objekterkennung ist eine zentrale Aufgabe im Bereich autonomer Fahrzeuge. Sie kann jedoch schwerfällig werden, wenn sich die Pose des eigenen Fahrzeugs bezüglich der Straßenebene ändert. Dies ist aufgrund geringfügiger Schwankungen in der Straßenglättigkeit und -neigung alltäglich. Aufgrund des fehlenden Verständnisses für industrielle Anwendungen ignorieren bestehende Methoden auf öffentlichen Datensätzen typischerweise die Kamerapose, was unweigerlich dazu führt, dass der Detektor empfindlich gegenüber externen Kameraparametern wird. Störungen der Objektpose sind in der Praxis von autonomen Fahrzeugen weit verbreitet. Um dies zu beheben, schlagen wir eine neue Methode vor, die die Kamerapose erfasst und einen Detektor entwickelt, der unabhängig von externen Störungen ist. Konkret ermöglicht der vorgeschlagene Ansatz die Vorhersage der externen Kameraparameter durch die Erkennung von Verschwindungspunkten und Änderungen der Horizontlinie. Ein Umwandlungsmodul wird zudem entworfen, um störende Merkmale im latenzraum zu korrigieren. Auf diese Weise arbeitet unser 3D-Detektor unabhängig von Variationen der externen Parameter und liefert präzise Ergebnisse in realistischen Szenarien, etwa auf unebenen oder schlaglochbelasteten Straßen, bei denen fast alle bestehenden monokularen Detektoren versagen. Experimente zeigen, dass unsere Methode im Vergleich zu anderen State-of-the-Art-Verfahren sowohl auf den KITTI 3D- als auch auf den nuScenes-Datensätzen deutlich überlegen ist.