Distances de Wasserstein pour l'estimation de disparité stéréoscopique

Les approches existantes pour l'estimation de profondeur ou de disparité produisent une distribution sur un ensemble de valeurs discrètes prédéfinies. Cela entraîne des résultats inexactes lorsque la profondeur ou la disparité réelle ne correspond à aucune de ces valeurs. Le fait que cette distribution soit généralement apprise indirectement par le biais d'une perte de régression cause des problèmes supplémentaires dans les régions ambiguës autour des contours des objets. Nous abordons ces problèmes en utilisant une nouvelle architecture de réseau neuronal capable de produire des valeurs de profondeur arbitraires, ainsi qu'une nouvelle fonction de perte dérivée de la distance de Wasserstein entre les distributions réelles et prédites. Nous validons notre approche sur diverses tâches, notamment l'estimation stéréoscopique de disparité et la détection d'objets 3D en aval. Notre méthode réduit considérablement l'erreur dans les régions ambiguës, en particulier autour des contours d'objets qui ont un impact majeur sur la localisation des objets en 3D, atteignant ainsi l'état de l'art en matière de détection d'objets 3D pour la conduite autonome. Notre code sera disponible sur https://github.com/Div99/W-Stereo-Disp.