HyperAIHyperAI

Command Palette

Search for a command to run...

التحسين الموجه بالنموذج لصور الوجوه بدون معالم الوجه

Berk Dogan Shuhang Gu Radu Timofte

الملخص

في الوقت الحاضر، بسبب وفرة الوسائط البصرية، هناك كميات كبيرة من صور الوجوه ذات الدقة العالية (HR) المتاحة بالفعل. لذلك، من المحتمل جداً العثور على صورة وجه أخرى ذات دقة عالية لنفس الشخص يمكن استخدامها لتسهيل عملية زيادة الدقة الفائقة (Super-Resolution). في هذا البحث، نقترح حلًا يستند إلى شبكة عصبية تقنية التعلم العميق بال��ول (Convolutional Neural Network - CNN)، والتي تُسمى GWAInet، وتقوم بزيادة الدقة الفائقة بمقدار 8 أضعاف لصور الوجوه باستخدام صورة وجه أخرى غير مقيدة ذات دقة عالية لنفس الشخص مع اختلافات محتملة في العمر أو التعبير أو الوضعية أو الحجم. يتم تدريب GWAInet بطريقة مولدة معادية (Adversarial Generative) لإنتاج نتائج صورية ذات جودة عالية. يتم تحقيق الاستفادة من الصورة الإرشادية ذات الدقة العالية من خلال استخدام فرع الشبكة المُحَوِّرة (Warper Subnetwork) التي تقوم بتوحيد محتوياتها مع الصورة المدخلة واستخدام سلسلة دمج الخصائص للخصائص المستخرجة من الصورة الإرشادية المحورة والصورة المدخلة. أثناء التدريب، يساعد خسارة الهوية (Identity Loss) في الحفاظ على الخصائص المتعلقة بالهوية عن طريق تقليل المسافة بين متجهات الانغراس (Embedding Vectors) للصور الفعلية ذات الدقة الفائقة والدقيقة. على عكس أفضل التقنيات الحالية في زيادة دقة الوجوه الفائقة، لا يتطلب طريقنا أي نقاط معالم للوجه للتدريب، مما يعزز متانته ويسمح له بإنتاج تفاصيل دقيقة أيضًا للمجال المحيط بالوجه بشكل موحد. ينتج طريقنا GWAInet صورًا شبه حقيقية عند زيادة الدقة بمقدار 8 أضعاف ويتفوق على أفضل التقنيات الحالية من حيث الجودة الكمية والحسية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp