HyperAIHyperAI
il y a 17 jours

MobileStereoNet : Vers des réseaux profonds légers pour la correspondance stéréo

Faranak Shamsafar, Samuel Woerz, Rafia Rahim, Andreas Zell
MobileStereoNet : Vers des réseaux profonds légers pour la correspondance stéréo
Résumé

Les méthodes récentes de correspondance stéréo ont constamment amélioré la précision grâce à l’utilisation de modèles profonds. Toutefois, cette amélioration s’accompagne d’une augmentation significative de la charge de calcul, au point que le réseau ne puisse même pas tenir sur une GPU modérée. Ce problème pose des difficultés lorsqu’il s’agit de déployer le modèle sur des dispositifs à ressources limitées. À cet effet, nous proposons deux modèles légers pour la vision stéréo, caractérisés par une complexité réduite sans compromettre la précision. En fonction de la dimension du volume de coût, nous concevons un modèle 2D et un modèle 3D, chacun basé sur une architecture d’encodeur-décodeur construite respectivement à partir de convolutions 2D et 3D. Pour cela, nous exploitons des blocs 2D MobileNet et les étendons à trois dimensions afin de les adapter à la vision stéréo. En outre, nous proposons un nouveau volume de coût qui améliore la précision du modèle 2D, lui permettant de rivaliser étroitement avec les réseaux 3D. Les expérimentations montrent que les réseaux 2D/3D proposés réduisent efficacement la charge de calcul (respectivement 27 %/95 % et 72 %/38 % de paramètres/opérations en moins pour les modèles 2D et 3D), tout en maintenant un haut niveau de précision. Notre code est disponible à l’adresse suivante : https://github.com/cogsys-tuebingen/mobilestereonet.

MobileStereoNet : Vers des réseaux profonds légers pour la correspondance stéréo | Articles de recherche récents | HyperAI