LOCL: تعلّم تكوين الكائن-الخاصية باستخدام التحديد

يصف هذا البحث منهج LOCL (Learning Object Attribute Composition using Localization) الذي يعمم التعلم المركب بدون عينات (zero-shot learning) على الكائنات في بيئات مزدحمة وواقعية أكثر. تم دراسة مشكلة الترابطات غير المرئية بين الكائنات والخصائص (OA) بشكل واسع في هذا المجال، إلا أن أداء الطرق الحالية محدود في المشاهد الصعبة. في هذا السياق، يكمن إسهامنا الرئيسي في اقتراح نهج منفصل (modular) لتحديد مواقع الكائنات والخصائص ذات الاهتمام في سياق تدريب غير مراقب بشكل ضعيف، بحيث يتمتع بأداء قوي وقابلاً للتوسع على التكوينات غير المرئية. يتفوق التوصيل بين التحديد المكاني وفِصْل التجميع (composition classifier) بشكل كبير على أفضل الطرق الحالية (SOTA)، مع تحقيق تحسن قدره حوالي 12٪ على المجموعات المتاحة حاليًا من البيانات الصعبة. علاوةً على ذلك، تتيح الطبيعة المنفصلة للنهج استخدام مُستخرج الميزات المُحدَّدة مكانيًا مع الطرق الحالية لتعلم التجميع الكائني-الخاصية (OA compositional learning) لتحسين أدائها العام.