HyperAIHyperAI
منذ 2 أشهر

الإ苦笑 generation مع تحسين مظهر الكائنات في التخطيط المستند إلى السياق 注意:这里的“苦笑”似乎是误译,正确的翻译应该是: الإنباء المتعلق بالسياق لتوليد الصور مع تحسين مظهر الكائنات في التخطيط

He, Sen ; Liao, Wentong ; Yang, Michael Ying ; Yang, Yongxin ; Song, Yi-Zhe ; Rosenhahn, Bodo ; Xiang, Tao
الإ苦笑 generation مع تحسين مظهر الكائنات في التخطيط المستند إلى السياق
注意:这里的“苦笑”似乎是误译,正确的翻译应该是:
الإنباء المتعلق بالسياق لتوليد الصور مع تحسين مظهر الكائنات في التخطيط
الملخص

نموذج توليد الصور من التخطيط (L2I) يهدف إلى إنشاء صورة معقدة تحتوي على عدة أشياء ضد خلفية طبيعية، بناءً على تخطيط معين مقدم. مستندًا إلى التطورات الحديثة في شبكات المولدات المتنافسة (GANs)، حققت النماذج الحالية لـ L2I تقدمًا كبيرًا. ومع ذلك، فإن فحصًا دقيقًا للصور التي تم توليدها يكشف عن قيود رئيسية اثنتين: (1) العلاقات بين الأشياء وأيضًا بين الأشياء والخلفيات غالبًا ما تكون مكسورة و(2) مظهر كل شيء عادة ما يكون مشوهًا، محرومًا من الخصائص الأساسية المرتبطة بفئة الشيء. نعتقد أن هذه القيود ناجمة عن عدم وجود ترميز سياقي للأشياء والخلفيات في مولداتهم، وعدم وجود تمثيل حساس للموقع لمظهر الأشياء في مميزاتهم. لمعالجة هذه القيود، تم اقتراح وحدتين جديدتين في هذا العمل. أولاً، تم تقديم وحدة تحويل السمات السياقية في المولد لضمان أن الترميز المولّد لكل من الأشياء أو الخلفيات يكون على دراية بالأشياء/الخلفيات الأخرى الموجودة في المشهد. ثانياً، بدلاً من تقديم سمات الصور غير الحساسة للموقع إلى المميز، نستخدم مصفوفة غرام التي يتم حسابها من خرائط السمات للصور المولدة للأجسام لحفظ المعلومات الحساسة للموقع، مما يؤدي إلى تعزيز كبير في مظهر الجسم. تُظهر التجارب الواسعة أن الطريقة المقترحة تحقق أداءً رائدًا على مقاييس COCO-Thing-Stuff و Visual Genome.

الإ苦笑 generation مع تحسين مظهر الكائنات في التخطيط المستند إلى السياق 注意:这里的“苦笑”似乎是误译,正确的翻译应该是: الإنباء المتعلق بالسياق لتوليد الصور مع تحسين مظهر الكائنات في التخطيط | أحدث الأوراق البحثية | HyperAI