HyperAIHyperAI

Command Palette

Search for a command to run...

التجميع المعزز للمعلومات من خلال التسمية الذاتية متعددة الأوجه

Foivos Ntelemis Yaochu Jin Spencer A. Thomas

الملخص

تُعد تجميع الصور مهمةً صعبةً في مجال رؤية الحاسوب، وتهدف إلى إنشاء تسميات تلقائية دون تدخل بشري. تتركز التطورات الحديثة على استخدام استراتيجيات التعلم ذاتي التوجيه في تجميع الصور، من خلال تعلم المعاني القيّمة أولاً، ثم تجميع تمثيلات الصور. ومع ذلك، فإن الخوارزميات متعددة المراحل هذه تزيد من الوقت الحسابي، وتعتمد أداءها النهائي على المرحلة الأولى. وبتوسيع النهج ذاتي التوجيه، نقترح طريقة جديدة لالتقسيم في مرحلة واحدة، تتعلم تمثيلات ذات معنى وتُعيّن التسميات المقابلة في آنٍ واحد. يتم تحقيق ذلك من خلال دمج تمثيل منفصل في النموذج ذاتي التوجيه عبر شبكة تصنيف. وبشكل خاص، تستخدم هدف التجميع المقترح مفهوم المعلومات المتبادلة، وتحاول تعظيم الاعتماد بين التمثيل المنفصل المدمج وتوزيع احتمالي منفصل. ويُستمد التوزيع الاحتمالي المنفصل من خلال عملية ذاتي التوجيه، وذلك بمقارنة التمثيل الخفي المتعلم مع مجموعة من البروتوتيبات القابلة للتدريب. ولتعزيز أداء الشبكة التصنيفية، نطبق بشكل مشترك مفهوم المعلومات المتبادلة عبر مرايا متعددة (multi-crop views). تُظهر النتائج التجريبية أن الإطار المقترح يتفوق على التقنيات الرائدة في مجالها، بتحقيق دقة متوسطة بلغت 89.1% و49.0% على مجموعتي بيانات CIFAR-10 وCIFAR-100/20 على التوالي. وأخيرًا، تُظهر الطريقة المقترحة أيضًا مقاومة جيدة تجاه إعدادات المعاملات، مما يجعلها جاهزة للتطبيق على مجموعات بيانات أخرى.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp