AtlantaNet: استنتاج التخطيط الداخلي ثلاثي الأبعاد من صورة واحدة 360(∘) تتجاوز افتراض عالم مانهاتن

نُقدِّم نهجًا جديدًا من نوع end-to-end لتقدير تخطيط غرفة ثلاثية الأبعاد من صورة دوارة واحدة. مقارنةً بالأساليب الحديثة المتميزة، فإن طريقة عملنا لا تقتصر على بيئات العالم المانهاتن (Manhattan World)، بل تُمكّن من إعادة بناء الغرف التي تُحَدَّد بجدران عمودية لا تشكل زوايا قائمة أو تكون منحنية — أي نماذج العالم أتلانتا (Atlanta World). في نهجنا، نُنَقِّل الصورة الدوارة الأصلية المُحاذاة للجاذبية إلى مستويين أفقيين، أحدهما فوق الكاميرا والآخر تحتها. تُخزِّن هذه التمثيلية جميع المعلومات الضرورية لاستعادة الأسطح الثلاثية الأبعاد المحدودة للغرفة ضمن نموذج العالم أتلانتا، على شكل مخطط مساحة الغرفة (2D) على الأرضية وارتفاع الغرفة. ولتقدير التخطيط ثلاثي الأبعاد، نقترح بنية شبكة عصبية تُشَكِّل مُشفِّرًا (encoder) وملمّاً (decoder)، وتستفيد من الشبكات العصبية التكرارية (RNNs) لالتقاط الأنماط الهندسية الطويلة المدى، كما تُوظِّف استراتيجية تدريب مخصصة تعتمد على معرفة متخصصة في المجال. تُظهر النتائج التجريبية أن طريقة عملنا تتفوّق على الحلول الرائدة في دقة التنبؤ، وبشكل خاص في الحالات التي تتضمّن تخطيطات جدران معقدة أو مسارات جدران منحنية.