Command Palette
Search for a command to run...
SPICE: التسمية الدلالية الوهمية لتصنيف الصور
SPICE: التسمية الدلالية الوهمية لتصنيف الصور
Chuang Niu, Member, IEEE Hongming Shan, Member, IEEE Ge Wang, Fellow, IEEE
الملخص
تشابه العينات والاختلاف بين المجموعات هما جانبان حاسمان في تجميع الصور. ومع ذلك، تعاني الطرق الحالية للتجميع العميق من تقدير غير دقيق لتشابه الخصائص أو الاختلاف الدلالي. في هذا البحث، نقدم إطارًا جديدًا يُسمى "التجميع الدلالي القائم على التسمية الوهمية" (SPICE)، والذي يقسم شبكة التجميع إلى نموذج خصائص لقياس تشابه المستوى الفردي ورأس تجميع لتحديد الاختلاف على مستوى المجموعة. صممنا خوارزميتين للنمذجة الوهمية الواعية بالدلالة، وهما النمذجة الوهمية النموذجية والنمذجة الوهمية الموثوقة، مما يمكن من الرقابة الذاتية الدقيقة والموثوقة على التجميع. دون استخدام أي تسميات حقيقية، نقوم بتحسين شبكة التجميع في ثلاث مراحل: 1) تدريب نموذج الخصائص باستخدام التعلم التبايني لقياس تشابه الفرد، 2) تدريب رأس التجميع باستخدام خوارزمية النمذجة الوهمية النموذجية لتحديد دلالات المجموعة، و 3) تدريب مشترك لنموذج الخصائص ورأس التجميع باستخدام خوارزمية النمذجة الوهمية الموثوقة لتحسين أداء التجميع. تظهر النتائج التجريبية الشاملة أن SPICE حققت تحسينات كبيرة (حوالي 10%) على الطرق الموجودة وحددت أفضل النتائج الجديدة للتجميع على ستة مجموعات بيانات مرجعية للصور بناءً على ثلاثة مقاييس شائعة. وبشكل مهم، فإن SPICE تعمل على تقليص الفجوة بشكل كبير بين التصنيف غير المشرف والتقييم الكامل؛ فعلى سبيل المثال، يوجد فرق دقة بنسبة 2% فقط (91.8% مقابل 93.8%) على مجموعة بيانات CIFAR-10. لقد جعلنا الكود متاحًا للعامة في الرابط التالي: https://github.com/niuchuangnn/SPICE.