NeRF: تمثيل المشاهد كحقول إشعاع عصبية لتركيب المناظر

نقدم طريقة تحقق نتائج متميزة في مجال إنشاء وجهات نظر جديدة لمشاهد معقدة من خلال تحسين دالة مشهد حجمية مستمرة باستخدام مجموعة نادرة من وجهات النظر المدخلة. يمثل خوارزمياتنا المشهد باستخدام شبكة عميقة متصلة بالكامل (غير تقاطعية)، حيث يكون الإدخال هو إحداثي مستمر واحد بـ 5 أبعاد (الموقع المكاني $(x,y,z)$ واتجاه الرؤية $(θ, ϕ)$) والإخراج هو الكثافة الحجمية والشعاع المنبعث المعتمد على الوجهة في ذلك الموقع المكاني. ننشئ وجهات النظر عن طريق استعلام إحداثيات 5 أبعاد على طول أشعة الكاميرا واستخدام تقنيات التصوير الحجمي التقليدية لتحويل الألوان والكثافات الناتجة إلى صورة. نظرًا لأن التصوير الحجمي قابل للتفاضل بشكل طبيعي، فإن الإدخال الوحيد المطلوب لتحسين تمثيلنا هو مجموعة من الصور ذات وضعيات الكاميرا المعروفة. نصف كيف يمكن تحسين حقول الشعاع العصبي بكفاءة لإنشاء وجهات نظر جديدة واقعية بصرياً للمشاهد ذات الهندسة والمظهر المعقد، ونعرض نتائج تتفوق على الأعمال السابقة في مجال التصوير العصبي وإنشاء وجهات النظر. تعتبر نتائج إنشاء وجهات النظر أفضل عند مشاهدتها كمقاطع فيديو، لذلك نحث القراء على مشاهدة الفيديو الإضافي الخاص بنا للحصول على مقارنات مقنعة.