HyperAIHyperAI

Command Palette

Search for a command to run...

LatentKeypointGAN: التحكم في الصور عبر النقاط المخفية الرئيسية

Xingzhe He Bastian Wandt Helge Rhodin

الملخص

حققت شبكات التوليد المتنافسة (GANs) جودة صورية واقعية في توليد الصور. ومع ذلك، فإن كيفية التحكم الأمثل في محتوى الصورة لا تزال تمثل تحديًا مفتوحًا. نقدم LatentKeypointGAN، وهي شبكة GAN ثنائية المرحلة يتم تدريبها بشكل شامل على الهدف التقليدي لـ GAN مع شروط داخلية على مجموعة من النقاط المكانية. تحتوي هذه النقاط على تمثيلات ظاهرية مرتبطة بها تتحكم بشكل منفصل في موقع وأسلوب الأشياء المُنشَأة وأجزائها. أحد الصعوبات الرئيسية التي نعالجها باستخدام هياكل شبكة وخطط تدريب مناسبة هو فصل الصورة إلى عوامل مكانية وظاهرية دون معرفة المجال وإشارات الإشراف. نثبت أن LatentKeypointGAN توفر فضاءًا خفيًا قابل للتفسير يمكن استخدامه لإعادة ترتيب الصور المُنشَأة عن طريق إعادة وضع وتبادل تمثيلات النقاط الرئيسية، مثل إنشاء صور شخصية بدمج العيون والأنف والفم من صور مختلفة. بالإضافة إلى ذلك، يتيح إنشاء النقاط الرئيسية بشكل واضح ومطابقة الصور طريقة جديدة قائمة على GAN للكشف عن النقاط الرئيسية دون إشراف.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp