HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 2 أشهر

مزيج من الخبراء العالميين والمحليين مع محول التفتيت لإنشاء وجوه قابلة للتحكم

Xuechao Zou Shun Zhang Xing Fu Yue Li Kai Li Yushe Cao Congyan Lang Pin Tao Junliang Xing

مزيج من الخبراء العالميين والمحليين مع محول التفتيت لإنشاء وجوه قابلة للتحكم

الملخص

تُشكّل إنشاء الوجه القابل للتحكم تحديات جوهرية في النمذجة التوليدية نظرًا للاتزان المعقد المطلوب بين التحكم في المعاني (السمantics) والواقعية الضوئية (photorealism). في حين يعاني النهج الحالية من صعوبة فصل التحكم في المعاني عن مسارات الإنشاء، نعيد النظر في الإمكانات المعمارية لمحولات التبديد (Diffusion Transformers - DiTs) من منظور التخصص المهني. يقدّم هذا البحث إطار عمل جديد يُسمّى Face-MoGLE، يتميز بـ: (1) نمذجة مساحات مُفصَّلة معنويًا من خلال تحليل مساحي مُشَرَّط بوضعية قناع (mask-conditioned space factorization)، ما يتيح التلاعب الدقيق بالسمات؛ (2) مزيج من خبراء عالميين ومحليين، يُمكّن من التقاط البنية الشاملة والمعاني على مستوى المناطق، مما يعزز التحكم الدقيق؛ (3) شبكة توجيه ديناميكية تُنتج معاملات تعتمد على الزمن وتتطور حسب خطوات التبديد والمواقع المكانية. يقدّم Face-MoGLE حلًا قويًا ومرنًا لإنشاء وجوه عالية الجودة قابلة للتحكم، ولديه إمكانات كبيرة في مجالات النمذجة التوليدية والتطبيقات الأمنية. أظهرت التجارب الواسعة فعالية النموذج في بيئات إنشاء الوجه متعددة النماذج (multimodal) وحيدة النموذج (monomodal)، كما أثبت قدرته القوية على التعميم الصفر (zero-shot). يمكن الاطلاع على صفحة المشروع من خلال الرابط التالي: https://github.com/XavierJiezou/Face-MoGLE.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مزيج من الخبراء العالميين والمحليين مع محول التفتيت لإنشاء وجوه قابلة للتحكم | الأوراق البحثية | HyperAI