HyperAIHyperAI

Command Palette

Search for a command to run...

π³ : Apprentissage de géométrie visuelle équivariant aux permutations, évolutif à grande échelle

Yifan Wang Jianjun Zhou Haoyi Zhu Wenzheng Chang Yang Zhou Zizun Li Junyi Chen Jiangmiao Pang Chunhua Shen Tong He

Résumé

Nous présentons pi³, un réseau neuronal à propagation avant qui offre une nouvelle approche pour la reconstruction de géométrie visuelle, rompant avec la dépendance à une vue de référence conventionnelle et fixe. Les méthodes précédentes s'appuient souvent sur un point de vue désigné, un biais inductif qui peut entraîner des instabilités et des échecs si la référence est sous-optimale. En revanche, pi³ utilise une architecture entièrement équivariante par permutation pour prédire des poses caméra affines invariantes et des cartes de points locaux invariantes à l'échelle, sans aucune trame de référence. Cette conception rend notre modèle intrinsèquement robuste à l'ordre des entrées et hautement évolutif. Ces avantages permettent à notre approche simple et sans biais d'atteindre des performances de pointe sur une large gamme de tâches, notamment l'estimation de pose caméra, l'estimation de profondeur mono/vidéo et la reconstruction de cartes de points denses. Le code source et les modèles sont disponibles au public.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
π³ : Apprentissage de géométrie visuelle équivariant aux permutations, évolutif à grande échelle | Articles | HyperAI