HyperAIHyperAI

Command Palette

Search for a command to run...

HR-Depth : Estimation monoscopique non supervisée de profondeur à haute résolution

Xiaoyang Lyu Liang Liu Mengmeng Wang Xin Kong Lina Liu Yong Liu Xinxin Chen Yi Yuan

Résumé

L'apprentissage auto-supervisé présente un grand potentiel pour l'estimation de profondeur à partir d'une seule caméra, en utilisant uniquement des séquences d'images comme source de supervision. Bien que des tentatives aient été faites pour exploiter des images à haute résolution afin d'améliorer l'estimation de profondeur, l'exactitude des prédictions n'a pas été significativement améliorée. Dans ce travail, nous identifions la raison fondamentale : une estimation de profondeur inexacte dans les régions à fort gradient, ce qui fait que l'erreur d'interpolation bilinéaire disparaît progressivement avec l'augmentation de la résolution. Pour obtenir une estimation de profondeur plus précise dans ces régions à fort gradient, il est essentiel d'extraire des caractéristiques à haute résolution riches en informations spatiales et sémantiques. Ainsi, nous proposons une version améliorée de DepthNet, appelée HR-Depth, basée sur deux stratégies efficaces : (1) une ré-architecture de la connexion de saut (skip-connection) dans DepthNet afin d'obtenir de meilleures caractéristiques à haute résolution, et (2) la proposition d'un module de fusion de caractéristiques, le module Squeeze-and-Excitation (fSE), pour une fusion plus efficace. En utilisant ResNet-18 comme encodeur, HR-Depth dépasse tous les méthodes de l'état de l'art (SoTA) précédentes, même avec le nombre minimal de paramètres, tant à haute qu'à basse résolution. De plus, les méthodes de l'état de l'art antérieures reposent sur des réseaux complexes et profonds, comportant un grand nombre de paramètres, ce qui limite leur application réelle. Par conséquent, nous avons également conçu un réseau léger utilisant MobileNetV3 comme encodeur. Les expériences montrent que ce réseau léger atteint des performances comparables à celles de nombreux modèles volumineux comme Monodepth2 à haute résolution, tout en utilisant seulement 20 % des paramètres. Tous les codes et modèles seront disponibles à l'adresse suivante : https://github.com/shawLyu/HR-Depth.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp