منذ 11 أيام
التركيب العصبي ثنائي الطبقات السريع لصور شخصية واقعية من صورة واحدة
Egor Zakharov, Aleksei Ivakhnenko, Aliaksandra Shysheya, Victor Lempitsky

الملخص
نُقدّم نظامًا مبنيًا على التوليد العصبي يُنشئ أفاتارًا للرأس من صورة واحدة. تعتمد طريقتنا على نمذجة مظهر الشخص من خلال تحليله إلى طبقتين. الطبقة الأولى هي صورة خشنة تعتمد على الوضعية، تُولَّد بواسطة شبكة عصبية صغيرة. أما الطبقة الثانية فهي صورة نسيجية لا تعتمد على الوضعية، وتحتوي على تفاصيل عالية التردد. تُولَّد صورة النسيج مسبقًا، ثم تُشَوَّه (تُحَوَّل) وتُضاف إلى الصورة الخشنة لضمان دقة فعالة عالية في الصور المُولَّدة للرأس. ونُقارن نظامنا بنماذج حديثة مماثلة من حيث الجودة البصرية والسرعة. تُظهر التجارب تحسنًا كبيرًا في سرعة الاستنتاج مقارنةً بالنماذج السابقة للavatars العصبية للرأس، مع الحفاظ على جودة بصرية محددة. كما نُقدّم تقريرًا عن تنفيذ نظامنا في بيئة حقيقية على أجهزة الهواتف الذكية بسرعة زمنية حقيقية.