اكتشاف الكائنات وتحديد موقعها المشترك دون إشراف من خلال تحويل الوصف العميق

تصبح تصميم النماذج القابلة لإعادة الاستخدام مرغوبًا فيه مع التوسع السريع لتطبيقات رؤية الحاسوب وتعلم الآلة. في هذه الورقة، نركز على قابلية إعادة استخدام النماذج العميقة المُدربة مسبقًا. تحديدًا، بخلاف التعامل مع النماذج المُدربة مسبقًا كمستخرجات للسمات، نكشف عن المزيد من الثروات تحت طبقات التحويل (convolutional layers)، أي أن تنشيطات التحويل (convolutional activations) يمكن أن تعمل ككاشف للأجسام المشتركة في مشكلة تحديد موقع الأجسام المشتركة في الصورة. نقترح طريقة بسيطة ومعتبرة فعالة، تُعرف باسم تحويل الوصفاء العميق (Deep Descriptor Transforming - DDT)، لتقييم ارتباطات الوصفاء ثم الحصول على المناطق المتسقة مع الفئة، والتي يمكنها تحديد الجسم المشترك بدقة في مجموعة من الصور غير المصنفة، أي اكتشاف الأجسام بدون إشراف. تؤكد الدراسات التجريبية فعالية الطريقة المقترحة DDT. على مجموعات البيانات المرجعية لتحديد موقع الأجسام المشتركة في الصورة، يتفوق DDT بشكل كبير على الأساليب الرائدة الحالية. بالإضافة إلى ذلك، يظهر DDT أيضًا قدرة جيدة على التعميم لفئات غير مشاهدة ومعالجة البيانات الضوضائية بثبات. بالإضافة إلى ما سبق، يمكن استخدام DDT أيضًا لجمع صور الويب كمصادر بيانات خارجية صالحة لتحسين أداء كل من تصنيف الصور وكشف الأجسام.