العمق شبه المُشرف للعامِل في تعميم المجال للكشف عن الأشياء من خلال محاذاة الميزات بقيادة اللغة

الطرق الحالية في التكيف بين المجالات (DA) والعمومية بين المجالات (DG) في اكتشاف الأشياء تفرض مواءمة الخصائص في الفضاء البصري ولكنها تواجه تحديات مثل تنوع مظهر الأشياء وتعقيد المشهد، مما يجعل من الصعب تمييز الأشياء وتحقيق الكشف الدقيق.在这篇论文中,我们首次通过探索视觉-语言预训练并通过对齐语言空间中的特征来解决半监督领域泛化的问题。في هذه الورقة البحثية، نحن أول من يعالج مشكلة العمومية شبه المراقبة بين المجالات من خلال استكشاف التدريب الأولي للرؤية واللغة وفرض مواءمة الخصائص عبر الفضاء اللغوي.نحن نستخدم طريقة جديدة تسمى التعلم الوصفي متعدد المقاييس بين المجالات (CDDMSL) بهدف تعظيم الاتفاق بين الوصف المعروض لصورة بخصائص خاصة بمجال مختلف في الفضاء المدمج. نحن نعتمد على طريقة جديدة تُعرف بالتعلم الوصفي متعدد المقاييس عبر المجالات (CDDMSL)، والتي تستهدف زيادة الاتفاق بين الوصف المعطى للصور التي تتميز بخصائص مختلفة حسب المجال في الفضاء المدمج.CDDMSL تتفوق بشكل كبير على الطرق الموجودة، حيث حققت تحسينًا بنسبة 11.7٪ و7.5٪ في إعدادات DG وDA على التوالي. التحليل الشامل والدراسات الاستقصائية تؤكد فعالية طريقتنا، مما يجعل CDDMSL خيارًا واعدًا للعمومية بين المجالات في مهام اكتشاف الأشياء. CDDMSL تتفوق بشكل كبير على الطرق الحالية، حيث حققت تحسينات بنسبة 11.7٪ و7.5٪ في إعدادات العمومية بين المجالات (DG) والتكييف بين المجالات (DA) على التوالي. التحليل الشامل والدراسات الاستبعادية أكدت فعالية طريقتنا، مما يضع CDDMSL كأحد الأساليب الواعدة للعمومية بين المجالات في مهام اكتشاف الأشياء.