LongSplat: التقطيع الثلاثي الأبعاد المتماسك للغبار ثلاثي الأبعاد المُحَدَّد بقوة لفيديوهات طويلة غير مُعدَّة مسبقًا

يُعالج LongSplat التحديات الحرجة في توليد المناظر الجديدة (NVS) من مقاطع فيديو طويلة تم التقاطها بشكل عشوائي، والتي تتميز بحركة كاميرا غير منتظمة، ووضعية كاميرا غير معروفة، ومشاهد واسعة النطاق. غالبًا ما تعاني الطرق الحالية من انحراف في وضعية الكاميرا، وبدء هندسي غير دقيق، وقيود شديدة في الذاكرة. ولحل هذه المشكلات، نقدم LongSplat، وهي إطار عمل مُقاوم لتقنيات التبليط ثلاثية الأبعاد باستخدام غاوسيات (3D Gaussian Splatting) دون الحاجة إلى وضعية كاميرا مسبقة، ويتميز بثلاث خصائص رئيسية: (1) تحسين مشترك تدريجي يُحسّن بشكل متزامن وضعيات الكاميرا والغاوسيات الثلاثية الأبعاد، مما يمنع البقاء في حلول محلية ويضمن الاتساق العالمي؛ (2) وحدة تقدير وضعية قوية تعتمد على معرفة مسبقة ثلاثية الأبعاد تم تعلّمها؛ (3) آلية فعّالة لتكوين الأسس (Octree Anchor Formation) التي تحوّل السحابة النقطية الكثيفة إلى نقاط أساسية بناءً على كثافة المكان. أظهرت التجارب الواسعة على معايير صعبة نتائج متميزة تُعدّ الأفضل في مجالها، حيث ساهمت في تحسين كبير في جودة العرض، ودقة وضعية الكاميرا، وكفاءة الحوسبة مقارنة بالطرق السابقة. صفحة المشروع: https://linjohnss.github.io/longsplat/