HyperAIHyperAI
منذ 2 أشهر

الكشف عن الأشياء بقليل من الصور عبر المجالات المختلفة باستخدام كاشف الأشياء المفتوح المعزز

Fu, Yuqian ; Wang, Yu ; Pan, Yixuan ; Huai, Lian ; Qiu, Xingyu ; Shangguan, Zeyu ; Liu, Tong ; Fu, Yanwei ; Van Gool, Luc ; Jiang, Xingqun
الكشف عن الأشياء بقليل من الصور عبر المجالات المختلفة باستخدام كاشف الأشياء المفتوح المعزز
الملخص

تتناول هذه الورقة البحثية تحدي الكشف عن الأشياء بقليل من الأمثلة في مجالات مختلفة (CD-FSOD)، بهدف تطوير كاشف أشياء دقيق للنماذج الجديدة بوجود أمثلة مصنفة قليلة. رغم أن الكاشفات المفتوحة القائمة على الترانسفورمر، مثل DE-ViT، تظهر وعودًا في الكشف عن الأشياء التقليدي بقليل من الأمثلة، فإن تعميمها إلى CD-FSOD لا يزال غير واضح: 1) هل يمكن لهذه الطرق المفتوحة أن تتعمم بسهولة إلى CD-FSOD؟ 2) إذا لم يكن كذلك، كيف يمكن تعزيز النماذج عند مواجهة فجوات مجالية كبيرة؟ لتقديم إجابة على السؤال الأول، نستخدم مقاييس تشمل الأسلوب، والاختلاف بين الفئات (Inter-Class Variance - ICV)، والحدود غير المحددة (Indefinable Boundaries - IB) لفهم الفجوة المجالية. بناءً على هذه المقاييس، ننشئ معيارًا جديدًا باسم CD-FSOD لتقييم طرق الكشف عن الأشياء، مما يكشف أن معظم النهج الحالية تفشل في التعميم عبر المجالات. تقنيًا، نلاحظ أن انخفاض الأداء مرتبط بالمقاييس التي اقترحناها: الأسلوب، ICV، وIB. نتيجة لذلك، نقترح عدة وحدات جديدة لمعالجة هذه المشكلات. أولاً، يتم مواءمة الخصائص القابلة للتعلم للأمثلة الأولية الثابتة مع الفئات المستهدفة لتعزيز تمييز الخصائص. ثانيًا، تقوم وحدة إعادة وزن الأمثلة بتعيين أهمية أكبر للأمثلة ذات الجودة العالية مع حدود غير محددة قليلة. ثالثًا، تشجع الوحدة الدومينية على خلق خصائص مقاومة للأساليب المختلفة من خلال تركيب مجالات تخيلية دون تغيير المحتوى الدلالي. تسهم هذه التقنيات مجتمعة في تطوير الترانسفورمر البصري عبر المجالات لـ CD-FSOD (CD-ViTO)، مما يحسن بشكل كبير على أساس DE-ViT. تؤكد النتائج التجريبية فعالية نموذجنا.

الكشف عن الأشياء بقليل من الصور عبر المجالات المختلفة باستخدام كاشف الأشياء المفتوح المعزز | أحدث الأوراق البحثية | HyperAI