HyperAIHyperAI

Command Palette

Search for a command to run...

شبكات مُنتجَة مُعاكسة تكافؤية محلية وعامة للصور لتجسيد المشهد المُوجه بالمعنى

Hao Tang Dan Xu Yan Yan Philip H. S. Torr Nicu Sebe

الملخص

في هذه الورقة، نتناول مهمة توليد المشهد الموجهة بالمعني. أحد التحديات المفتوحة في توليد المشاهد هو صعوبة توليد الأشياء الصغيرة والنصوص التفصيلية المحلية، وهي مشكلة شائعة في الطرق التي تعتمد على التوليد على مستوى الصورة بأكملها. لمعالجة هذه المشكلة، ننظر في هذه الدراسة إلى تعلُّم توليد المشهد في سياق محلي، ونُصمم بشكل مُناسب شبكة توليدية محلية مُخصصة للصفات، باستخدام خرائط المعنى كدليل، حيث تقوم ببناء وتعلُّم مُولِّدات فرعية منفصلة تركز على توليد فئات مختلفة، وتمكّن من تقديم تفاصيل أكثر في المشهد. ولتحسين تمييز تمثيلات الميزات المخصصة للصفات في السياق المحلي، نقترح أيضًا وحدة تصنيف جديدة. ولدمج المزايا المتوفرة في كل من التوليد على مستوى الصورة الكاملة والتوليد المخصص للصفات المحلية، نصمم شبكة توليد مشتركة مزودة بوحدة دمج انتباهية وهيكل مزدوج المُميِّز. أظهرت التجارب الواسعة على مهامين لتوليد صور المشاهد أداءً توليدياً متفوّقاً للنموذج المقترح. وقد تم تحقيق نتائج من الطراز الرائد بفارق كبير في كلا المهمتين وفي معايير عامة صعبة. يُمكن الوصول إلى الشفرة المصدرية والنموذج المدرب من خلال الرابط: https://github.com/Ha0Tang/LGGAN.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp