Trennbarer Fluss: Lernen von Bewegungskostenvolumen zur optischen Flussschätzung

Vollbewegungs-Kostenvolumina spielen eine zentrale Rolle in aktuellen state-of-the-art-Methoden zur optischen Flussberechnung. Sie werden jedoch aufgrund einfacher Merkmalskorrelationen konstruiert und verfügen daher über keine Fähigkeit, vorherige oder sogar nicht-lokale Kenntnisse zu erfassen. Dies führt zu Artefakten in schlecht eingeschränkten, mehrdeutigen Regionen, wie beispielsweise occludierte oder texturlose Bereiche. Wir stellen ein separables Kostenvolumenmodul vor, das als direkter Ersatz für Korrelationskostenvolumina dient und nicht-lokale Aggregationslayer nutzt, um globale Kontextinformationen und vorherige Kenntnisse auszunutzen, um die Bewegungen in diesen Regionen zu entwirren. Unsere Methode erzielt sowohl auf den etablierten Benchmarks Sintel als auch KITTI eine höhere Genauigkeit und zeigt zudem eine bessere Generalisierbarkeit von synthetischen auf reale Daten.