LayoutNet : Reconstruction de la disposition 3D d'une pièce à partir d'une seule image RGB

Nous proposons un algorithme pour prédire la disposition d'une pièce à partir d'une seule image, capable de généraliser sur les panoramas et les images en perspective, ainsi que sur les dispositions cuboïdes et plus générales (par exemple, une pièce en forme de L). Notre méthode opère directement sur l'image panoramique, contrairement aux travaux récents qui décomposent l'image en images en perspective. Notre architecture de réseau est similaire à celle de RoomNet, mais nous montrons des améliorations grâce à l'alignement de l'image basé sur les points de fuite, à la prédiction de plusieurs éléments de disposition (coins, limites, taille et translation) et à l'ajustement d'une disposition manhattan contrainte aux prédictions résultantes. Notre méthode se compare favorablement en termes de vitesse et de précision aux autres travaux existants sur les panoramas, atteint parmi les meilleures précisions pour les images en perspective et peut gérer à la fois des dispositions cuboïdes et des dispositions manhattan plus générales.