HyperAIHyperAI

Command Palette

Search for a command to run...

StyTr2: نقل الأسلوب الصوري باستخدام المحولات

Changsheng Xu Lei Wang Xingjia Pan Chongyang Ma WeiMing Dong Fan Tang Yingying Deng

الملخص

يهدف نقل نمط الصورة إلى إنتاج صورة تتميز بسمات فنية موجهة بواسطة مرجع نمطي مع الحفاظ على المحتوى الأصلي. وبسبب الطبيعة المحلية في الشبكات العصبية التلافيفية (CNN)، يصعب استخلاص وحفظ المعلومات الشاملة للصور المدخلة. ونتيجة لذلك، تواجه الطرق التقليدية لنقل النمط العصبي تمثيلًا متحيزًا للمحتوى. ولحل هذه المشكلة الحرجة، نأخذ في الاعتبار الاعتماديات طويلة المدى للصور المدخلة في نقل النمط من خلال اقتراح نهج مبني على المُحَوِّل (Transformer) يُسمى StyTr^2. على عكس المحولات البصرية المستخدمة في مهام الرؤية الأخرى، يحتوي StyTr^2 على مُشفرَيْن مختلفَين مبنيَّين على المُحَوِّل لإنشاء تسلسلات مخصصة للنطاقين: المحتوى والنمط، على التوالي. وبعد هذه المشفرات، يتم استخدام مُفكِّك متعدد الطبقات مبني على المُحَوِّل لتلوين تسلسل المحتوى وفقًا لتسلسل النمط. كما نحلل العيوب الموجودة في طرق الترميز المكاني الحالية، ونقترح طريقة جديدة تُسمى الترميز المكاني الواعي بالمحتوى (CAPE)، والتي تكون غير حساسة للقياس (scale-invariant) وتناسب بشكل أفضل مهام نقل نمط الصورة. وتوحي النتائج الكمية والكيفية بفعالية الاقتراح StyTr^2 مقارنة بالطرق الحديثة القائمة على CNN والطرق القائمة على التدفق. يمكن الوصول إلى الكود والنماذج عبر الرابط: https://github.com/diyiiyiii/StyTR-2.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp