HyperAIHyperAI
منذ 2 أشهر

استرجاع الصور باستخدام CNN يتعلم من BoW: التعديل الدقيق غير المشرف باستخدام الأمثلة الصعبة

Filip Radenović; Giorgos Tolias; Ondřej Chum
استرجاع الصور باستخدام CNN يتعلم من BoW: التعديل الدقيق غير المشرف باستخدام الأمثلة الصعبة
الملخص

شبكات العصب الاصطناعية المتلافهة (CNNs) تحقق أداءً رائدًا في العديد من مهام الرؤية الحاسوبية. ومع ذلك، فإن هذا الإنجاز يسبقته عملية تسمية يدوية متطرفة لإجراء التدريب من الصفر أو التعديل الدقيق للarefa المحددة. في هذا البحث، نقترح تعديل شبكات العصب الاصطناعية المتلافهة (CNNs) لاسترجاع الصور من مجموعة كبيرة من الصور غير المرتبة بطريقة آلية تمامًا. نستخدم أساليب استرجاع وبناء النموذج ثلاثي الأبعاد من الحركة (SfM) الرائدة للحصول على نماذج ثلاثية الأبعاد، والتي تُستخدم لإرشاد اختيار بيانات التدريب لتعديل شبكات العصب الاصطناعية المتلافهة (CNNs). نوضح أن كلًا من الأمثلة الإيجابية الصعبة والأمثلة السلبية الصعبة تحسن الأداء النهائي بشكل خاص في استرجاع الكائنات باستخدام الأكواد المضغوطة.