إلى إعادة بناء الوجه الأحادي الدقة العالية مع انعكاسات غنية باستخدام التعلم ذاتي التوجيه ومحاكاة الأشعة

إعادة بناء الوجه بشكل موثوق من صورة مفردة في ظروف إضاءة عامة يُعد تحديًا كبيرًا. لقد فتحت الطرق التي تدمج بين مشغلات الشبكات العصبية العميقة ونماذج التصوير القابل للتمييز طريقًا لاستعادة هندسية سريعة جدًا للشكل والإضاءة والانعكاسية. كما يمكن تدريبها بطريقة ذاتية التغذية (self-supervised) لتعزيز الموثوقية وتحسين التعميم. ومع ذلك، فإن نماذج تكوين الصورة القائمة على التبليط القابل للتمييز (differentiable rasterization) التي تعتمد عليها هذه الطرق، فضلًا عن التمثيل المكاني الأساسي لها، تحد من قدرتها على التعامل مع انعكاسات الوجه اللامبرتية (Lambertian) فقط، وتؤدي إلى تفاصيل هندسية ضعيفة. في الآونة الأخيرة، تم تقديم التتبع الشعاعي (ray tracing) في سياق إطار استنادًا إلى التحسين التقليدي لإعادة بناء الوجه من صورة مفردة، مما مكّن من تحقيق نتائج تُعد من أفضل النتائج الممكنة حاليًا. ولكن الطرق القائمة على التحسين تكون بطبيعتها بطيئة جدًا، وتفتقر إلى الموثوقية. في هذا البحث، نبني عملنا على الأساليب المذكورة أعلاه، ونقترح طريقة جديدة تُحسّن بشكل كبير من جودة الاستعادة وموثوقيتها في المشاهد العامة. ونحقق ذلك من خلال دمج مشغل CNN مع مُرسِّم شعاعي قابل للتمييز، ما يمكّننا من الاعتماد على انعكاسية مُخصصة أكثر دقة (مُختلفة وملوّنة) ونموذج إضاءة أكثر تطورًا، بالإضافة إلى تمثيل واقعي للظلال الذاتية (self-shadows). هذا يتيح لنا تحقيق قفزة كبيرة في جودة استعادة الشكل والملمس والإضاءة، حتى في المشاهد التي تكون فيها الإضاءة معقدة. وبفضل استعادة متسقة لخصائص الوجه، تُمكّن طريقتنا من تطبيقات عملية مثل إعادة الإضاءة وإزالة الظلال الذاتية. مقارنةً بالأساليب الرائدة حاليًا، تُظهر نتائجنا دقة أعلى وموثوقية أكبر في الأداء.