GENIE: التشفير الغاوسي للحقول الإشعاعية العصبية للتعديل التفاعلي

تحوّلت حقول الإشعاع العصبي (Neural Radiance Fields - NeRF) وتقنيّة تبديد الغاوسيان (Gaussian Splatting - GS) مؤخرًا إلى رائدتين في تمثيل المشاهد ثلاثية الأبعاد وعرضها. حيث تُحقّق NeRF توليدًا لمشاهد جديدة عالية الدقة من خلال تعلّم تمثيلات حجومية باستخدام الشبكات العصبية، لكن التشفير الضمني الذي تعتمده يُصعّب عمليات التعديل والتفاعل الفيزيائي. في المقابل، تمثّل GS المشاهد كمجموعة صريحة من العناصر الغاوسيّة، مما يتيح عرضًا في الوقت الفعلي، وتدريبًا أسرع، وتعديلًا أكثر سهولة ووضوحًا. وقد جعل هذا الهيكل الصريح من GS مناسبة بشكل خاص للتعديل التفاعلي ودمجها مع المحاكاة القائمة على الفيزياء. في هذا البحث، نقدّم نموذج GENIE (Gaussian Encoding for Neural Radiance Fields Interactive Editing)، وهو نموذج هجين يجمع بين جودة العرض الواقعية لـ NeRF والتمثيل القابل للتعديل والمنسّق لـ GS. بدلًا من استخدام التوافقيات الكروية (Spherical Harmonics) في نمذجة المظهر، نُعَيّن لكل غاوسي مُدمَجًا ميزة قابلة للتدريب (feature embedding). وتُستخدم هذه المدمجات لتوجيه شبكة NeRF بناءً على أقرب k غاوسيًا لكل نقطة استعلام. ولجعل هذا التوجيه فعّالًا، نقدّم تقنية البحث عن القرب الغاوسي المُعتمدة على التتبع الشعاعي (Ray-Traced Gaussian Proximity Search - RT-GPS)، وهي طريقة سريعة للبحث عن أقرب غاوسي باستخدام مسار معدّل لعملية التتبع الشعاعي. كما ندمج شبكة هاش متعددة الدقة (multi-resolution hash grid) لتوليد وتحديث مدمجات الغاوسيات. وتمكّن هذه العناصر معًا من تعديل في الوقت الفعلي واعٍ للمساحة: فعندما تُعاد ترتيب أو تعديل العناصر الغاوسيّة، يُعكس تأثيرها المُتكامل فورًا في الناتج المرئي. وباستخدام مزايا التمثيلات الضمنية والصريحة معًا، يُمكّن GENIE من التلاعب بالمشهد بسلاسة، والتفاعل الديناميكي، والتوافق مع المحاكاة الفيزيائية، مُغلِّبًا الفجوة بين التعديل القائم على الهندسة وتقنيات التصوير العصبي. يمكن الاطلاع على الكود عبر الرابط التالي: (https://github.com/MikolajZielinski/genie)