FineGAN: فك التشابك الهرمي غير المشرف لتكوين الأشياء بدقة عالية واكتشافها

نقترح FineGAN، إطارًا جديدًا وغير مشرف عليه لشبكات التوليد المعاكسة (GAN)، والذي يفصل الخلفية وشكل الكائن ومظهر الكائن لتوليد صور تفصيلية دقيقة لفئات كائنات محددة بدقة. لفصل العوامل دون إشراف، فإن الفكرة الرئيسية لدينا هي استخدام نظرية المعلومات لربط كل عامل برمز خفي (latent code)، وتحديد العلاقات بين الأكواد بطريقة معينة لإحداث الهرم المرغوب. من خلال التجارب الواسعة، نوضح أن FineGAN يحقق الفصل المطلوب لتوليد صور واقعية ومتنوعة تنتمي إلى فئات تفصيلية دقيقة للطيور والكلاب والسيارات. باستخدام الخصائص التي تم تعلمها تلقائيًا بواسطة FineGAN، قمنا أيضًا بتجميع الصور الحقيقية في محاولة أولى لحل المشكلة الجديدة المتعلقة باكتشاف فئات الكائنات التفصيلية الدقيقة بدون إشراف. يمكن العثور على شفرتنا/نماذجنا/عرضنا التوضيحي على الرابط: https://github.com/kkanshul/finegan