Command Palette
Search for a command to run...
شبكات مُنتجَة مُعاكسة تكافؤية محلية وعامة للصور لتجسيد المشهد المُوجه بالمعنى
شبكات مُنتجَة مُعاكسة تكافؤية محلية وعامة للصور لتجسيد المشهد المُوجه بالمعنى
Hao Tang Dan Xu Yan Yan Philip H. S. Torr Nicu Sebe
الملخص
في هذه الورقة، نتناول مهمة توليد المشهد الموجهة بالمعني. أحد التحديات المفتوحة في توليد المشاهد هو صعوبة توليد الأشياء الصغيرة والنصوص التفصيلية المحلية، وهي مشكلة شائعة في الطرق التي تعتمد على التوليد على مستوى الصورة بأكملها. لمعالجة هذه المشكلة، ننظر في هذه الدراسة إلى تعلُّم توليد المشهد في سياق محلي، ونُصمم بشكل مُناسب شبكة توليدية محلية مُخصصة للصفات، باستخدام خرائط المعنى كدليل، حيث تقوم ببناء وتعلُّم مُولِّدات فرعية منفصلة تركز على توليد فئات مختلفة، وتمكّن من تقديم تفاصيل أكثر في المشهد. ولتحسين تمييز تمثيلات الميزات المخصصة للصفات في السياق المحلي، نقترح أيضًا وحدة تصنيف جديدة. ولدمج المزايا المتوفرة في كل من التوليد على مستوى الصورة الكاملة والتوليد المخصص للصفات المحلية، نصمم شبكة توليد مشتركة مزودة بوحدة دمج انتباهية وهيكل مزدوج المُميِّز. أظهرت التجارب الواسعة على مهامين لتوليد صور المشاهد أداءً توليدياً متفوّقاً للنموذج المقترح. وقد تم تحقيق نتائج من الطراز الرائد بفارق كبير في كلا المهمتين وفي معايير عامة صعبة. يُمكن الوصول إلى الشفرة المصدرية والنموذج المدرب من خلال الرابط: https://github.com/Ha0Tang/LGGAN.