HyperAIHyperAI

Command Palette

Search for a command to run...

GAN متعدد القنوات مع انتقاء الانتباه التتابعي بالإرشاد الدلالي لترجمة الصور بين وجهات النظر المتقاطعة

Hao Tang Dan Xu Nicu Sebe Yanzhi Wang Jason J. Corso Yan Yan

الملخص

ترجمة الصور بين وجهات النظر المختلفة هي تحدي بسبب الاختلاف الكبير في وجهات النظر والتشوه الشديد. في هذا البحث، نقترح نهجًا جديدًا يُسمى Multi-Channel Attention SelectionGAN (SelectionGAN)، والذي يجعل من الممكن إنشاء صور لمناظر طبيعية من وجهات نظر عشوائية، بناءً على صورة للمنظر وخارطة معنوية جديدة. يتكون النموذج المقترح SelectionGAN من مرحلتين ويستخدم المعلومات المعنوية بشكل صريح. في المرحلة الأولى، يتم تغذية الصورة المشروطة والخارطة المعنوية المستهدفة إلى شبكة توليد موجهة بالمعنى الدائرة لإنتاج نتائج خشنة أولية. في المرحلة الثانية، نقوم بتحسين النتائج الأولية باستخدام آلية اختيار الانتباه متعددة القنوات. بالإضافة إلى ذلك، يتم استخدام خرائط عدم اليقين التي تم تعلمها تلقائيًا من الانتباهات لتوجيه الخسارة البكسلية لتحقيق تحسين أفضل في الشبكة. أظهرت التجارب الواسعة على مجموعات البيانات Dayton وCVUSA وEgo2Top أن نموذجنا قادر على إنتاج نتائج أفضل بكثير من الأساليب الرائدة حاليًا. يمكن الحصول على الكود المصدر والبيانات والنماذج المدربة من الرابط: https://github.com/Ha0Tang/SelectionGAN.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
GAN متعدد القنوات مع انتقاء الانتباه التتابعي بالإرشاد الدلالي لترجمة الصور بين وجهات النظر المتقاطعة | مستندات | HyperAI