HyperAIHyperAI

Command Palette

Search for a command to run...

MonoScene : Complétion monulaire de la scène sémantique 3D

Anh-Quan Cao Raoul de Charette

Résumé

MonoScene propose un cadre de complétion sémantique 3D de scène (SSC), où la géométrie dense et les sémantiques d'une scène sont inférées à partir d'une seule image RGB monoculaire. Contrairement à la littérature SSC, qui repose sur des entrées 2.5D ou 3D, nous résolvons le problème complexe de la reconstruction 3D de scènes à partir d'images 2D tout en inférant conjointement leurs sémantiques. Notre cadre repose sur des UNets successifs 2D et 3D, reliés par une nouvelle projection de caractéristiques 2D-3D inspirée de l'optique, et introduit une relation contextuelle 3D pour imposer la cohérence spatio-sémantique. En plus des contributions architecturales, nous introduisons de nouvelles pertes globales de scène et locales de frustums. Les expériences montrent que nous surpassons la littérature sur tous les métriques et jeux de données, tout en générant des scènes plausibles même au-delà du champ de vision de la caméra. Notre code et nos modèles entraînés sont disponibles à l'adresse suivante : https://github.com/cv-rits/MonoScene.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
MonoScene : Complétion monulaire de la scène sémantique 3D | Articles | HyperAI