Bewegungstrennung durch die Nutzung komplementärer geometrischer Modelle

Viele reale Sequenzen können nicht bequem als allgemein oder degeneriert klassifiziert werden; in solchen Fällen würde die Erzwingung einer falschen Dichotomie durch die Verwendung des Fundamentalmatrix-Modells oder des Homographie-Modells für die Bewegungssegmentierung zu Schwierigkeiten führen. Auch bei der Konfrontation mit einer allgemeinen Szenenbewegung leidet der Ansatz mit der Fundamentalmatrix als Modell für die Bewegungssegmentierung an mehreren Mängeln, die wir in dieser Arbeit diskutieren. Das volle Potenzial des Fundamentalmatrix-Ansatzes könnte nur dann vollständig ausgeschöpft werden, wenn wir gezielt Informationen aus dem einfachen Homographie-Modell nutzen. Aus diesen Überlegungen schlagen wir einen multiview-spektralen Clustering-Rahmen vor, der mehrere Modelle synergetisch kombiniert. Wir zeigen, dass sich die Leistung auf diese Weise erheblich verbessern lässt. Wir führen umfangreiche Tests auf bestehenden Bewegungssegmentierung-Datensätzen durch und erreichen den Stand der Technik in allen von ihnen; zudem präsentieren wir einen realistischeren und anspruchsvolleren Datensatz, der vom KITTI-Benchmark abgeleitet ist und realweltliche Effekte wie starke Perspektiven und starke Vorwärtsverschiebungen enthält, die in traditionellen Datensätzen nicht vorkommen.请注意,这里“多视图”被翻译为“multiview”,这是在计算机视觉领域常用的术语。同时,“谱聚类框架”被翻译为“spektralen Clustering-Rahmen”,这也是一个常见的德语术语。其他专业术语如“Fundamentalmatrix”(基础矩阵)、“Homographie”(单应性)和“Bewegungssegmentierung”(运动分割)也保持了其专业性。