التحميص الثلاثي الأبعاد المُختَزَل للانطلاق المُسرّع لتصورات المنظور الجديدة

في الآونة الأخيرة، تم تقديم إعادة بناء مشهد عالي الدقة باستخدام تمثيل مُحسَّن لـ "البقع ثلاثية الأبعاد الغاوسية" (3D Gaussian splat) لاستخلاص رؤى جديدة من مجموعات صور محدودة. لجعل هذا التمثيل مناسبًا لتطبيقات مثل البث عبر الشبكة وعرض الصور على الأجهزة ذات الطاقة المنخفضة، يلزم تقليل استهلاك الذاكرة بشكل كبير، إلى جانب تحسين كفاءة العرض. نقترح تمثيلًا مُضغوطًا لـ "البقع ثلاثية الأبعاد الغاوسية" يعتمد على تجميع المتجهات المُدرَكة للحساسية، مع تدريب مُدرك للقياس (quantization-aware training)، لضغط الألوان الاتجاهية وبارامترات الغاوس. تُظهر الكودبوكس المُتعلمة معدلات بت منخفضة، وتُحقّق معدل ضغط يصل إلى 31 مرة في المشاهد الواقعية، مع تدهور بسيط جدًا في الجودة البصرية. نُظهر أن التمثيل المضغوط يمكن عرضه بكفاءة باستخدام التحويل الراسيرية المُHardware على وحدات معالجة الرسوميات الخفيفة، بسرعة تصل إلى 4 أضعاف أعلى من السرعة المُبلغ عنها باستخدام مسار حسابي مُحسَّن على وحدة معالجة الرسوميات (GPU). وتشير التجارب الواسعة عبر عدة مجموعات بيانات إلى متانة الأسلوب المقترح وسرعته في العرض.