HyperAIHyperAI
منذ 16 أيام

التجميع المعزز للمعلومات من خلال التسمية الذاتية متعددة الأوجه

Foivos Ntelemis, Yaochu Jin, Spencer A. Thomas
التجميع المعزز للمعلومات من خلال التسمية الذاتية متعددة الأوجه
الملخص

تُعد تجميع الصور مهمةً صعبةً في مجال رؤية الحاسوب، وتهدف إلى إنشاء تسميات تلقائية دون تدخل بشري. تتركز التطورات الحديثة على استخدام استراتيجيات التعلم ذاتي التوجيه في تجميع الصور، من خلال تعلم المعاني القيّمة أولاً، ثم تجميع تمثيلات الصور. ومع ذلك، فإن الخوارزميات متعددة المراحل هذه تزيد من الوقت الحسابي، وتعتمد أداءها النهائي على المرحلة الأولى. وبتوسيع النهج ذاتي التوجيه، نقترح طريقة جديدة لالتقسيم في مرحلة واحدة، تتعلم تمثيلات ذات معنى وتُعيّن التسميات المقابلة في آنٍ واحد. يتم تحقيق ذلك من خلال دمج تمثيل منفصل في النموذج ذاتي التوجيه عبر شبكة تصنيف. وبشكل خاص، تستخدم هدف التجميع المقترح مفهوم المعلومات المتبادلة، وتحاول تعظيم الاعتماد بين التمثيل المنفصل المدمج وتوزيع احتمالي منفصل. ويُستمد التوزيع الاحتمالي المنفصل من خلال عملية ذاتي التوجيه، وذلك بمقارنة التمثيل الخفي المتعلم مع مجموعة من البروتوتيبات القابلة للتدريب. ولتعزيز أداء الشبكة التصنيفية، نطبق بشكل مشترك مفهوم المعلومات المتبادلة عبر مرايا متعددة (multi-crop views). تُظهر النتائج التجريبية أن الإطار المقترح يتفوق على التقنيات الرائدة في مجالها، بتحقيق دقة متوسطة بلغت 89.1% و49.0% على مجموعتي بيانات CIFAR-10 وCIFAR-100/20 على التوالي. وأخيرًا، تُظهر الطريقة المقترحة أيضًا مقاومة جيدة تجاه إعدادات المعاملات، مما يجعلها جاهزة للتطبيق على مجموعات بيانات أخرى.

التجميع المعزز للمعلومات من خلال التسمية الذاتية متعددة الأوجه | أحدث الأوراق البحثية | HyperAI