CompGS: تباعد جاوسية أصغر وأسرع باستخدام التكميم المتجهي

يُعدّ التبقيت الثلاثي للغوس (3D Gaussian Splatting - 3DGS) طريقة جديدة لتمثيل وعرض الحقول الإشعاعية ثلاثية الأبعاد، وتُحقق وقت تعلّم وعرض أسرع بكثير مقارنةً بالطرق المتطورة الحالية لـ NeRF. ومع ذلك، يُعاني هذا الأسلوب من عيبٍ متمثل في الحاجة إلى مساحة تخزين أكبر مقارنةً بطرق NeRF، نظرًا لضرورة تخزين المعاملات الخاصة بعدد كبير من الغوسات الثلاثية الأبعاد. لاحظنا أن العديد من الغوسات قد تمتلك معاملات متشابهة، لذا قمنا بتقديم طريقة بسيطة لتقريب المعاملات باستخدام التجميع المتجهي (Vector Quantization) المستند إلى خوارزمية K-means، أثناء عملية التحسين. ثم نقوم بتخزين مكتبة صغيرة من الرموز (codebook) مع مؤشر لكل غوسيان يشير إلى الرمز المقابل. ونُكثّف مؤشرات الغوسات أكثر من خلال ترتيبها واستخدام طريقة مشابهة لتقنية التشفير الطولي (run-length encoding). علاوةً على ذلك، نستخدم منظمًا بسيطًا يُشجع على انعدام الشفافية (Opacity صفر) في الغوسات (أي الغوسات غير المرئية)، مما يقلل بشكل كبير من مساحة التخزين ووقت العرض من خلال تقليل عدد الغوسات الفعالة. أجرينا تجارب واسعة على معايير قياسية، بالإضافة إلى مجموعة بيانات ثلاثية الأبعاد موجودة تُعدّ أكبر بمرتبة واحدة من المعايير القياسية المستخدمة في هذا المجال. ونُظهر أن طريقة التبسيط هذه، البسيطة لكنها فعّالة، تستطيع تقليل تكلفة التخزين في 3DGS بنسبة تصل إلى 40 إلى 50 مرة، وتقليل وقت العرض بنسبة 2 إلى 3 مرات، مع انخفاض ضئيل جدًا في جودة الصور المُنتجة.