اكتشاف الأشياء بإشراف ضعيف من خلال الشبكات المولدة المعادية والمرتبة

أظهرت الشبكات العصبية التوليدية المضادة العميقة (GAN) مؤخرًا أنها واعدة لتطبيقات مختلفة في رؤية الحاسوب، مثل تحرير الصور، وإنتاج صور ذات دقة عالية، وإنشاء مقاطع الفيديو، إلخ. يمكن لهذه الشبكات والخوارزميات التعليمية المرتبطة بها التعامل مع مجموعة متنوعة من الخرائط البصرية. نتناول الشبكات العصبية التوليدية المضادة (GAN) باستخدام طريقة تدريب جديدة وهدف تعليمي جديد لاكتشاف العديد من الحالات للأشياء في ثلاث حالات: 1) إنتاج صورة لشيء محدد داخل مشهد معقد؛ 2) تحديد فئات مختلفة في الصور للكشف عن الأشياء تحت الإشراف الضعيف؛ و3) تحسين اكتشاف الأشياء في أنابيب الكشف عن الأشياء. من المزايا الأساسية لطريقتنا أنها تتعلم مقياس تشابه عميقًا جديدًا لتمييز عدة أشياء في صورة واحدة. نوضح أن الشبكة يمكن أن تعمل كمُشفِّر ومُفكِّك لإنتاج أجزاء من الصورة تحتوي على شيء ما، أو كشبكة عصبية عميقة معدلة لتمثيل الصور للكشف عن الأشياء في الإشراف الكامل والإشراف الضعيف. يقدم تصنيفنا للشبكات العصبية التوليدية المضادة (GAN) طريقة جديدة للبحث في الصور عن أنماط خاصة بالأشياء. قمنا بإجراء تجارب لمواقف مختلفة وأظهرنا أداء الطريقة في إنتاج الأشياء والكشف عنها وتقييمها تحت الإشراف الضعيف باستخدام مجموعات البيانات MS-COCO وPASCAL VOC.