HyperAIHyperAI

Command Palette

Search for a command to run...

استكشاف حدود التجميع العميق للصور باستخدام النماذج المُدرَّبة مسبقًا

Nikolas Adaloglou Felix Michels Hamza Kalisch Markus Kollmann

الملخص

نقدّم منهجية عامة تتعلم تصنيف الصور دون استخدام تسميات من خلال الاستفادة من مستخرجات الميزات المُدرّبة مسبقًا. يعتمد نهجنا على تدريب ذاتي (self-distillation) لرؤوس التجميع، معتمدًا على حقيقة أن الجيران الأقرب في الفضاء المميز المُدرّب مسبقًا من المرجّح أن يشتركا في نفس التسمية. نقترح دالة تكلفة جديدة تتعلم الارتباطات بين ميزات الصور من خلال إدخال نسخة معدلة من المعلومات التبادلية النقطية (pointwise mutual information) إلى جانب وزن الأمثلة. نُظهر أن الدالة المقترحة قادرة على تقليل تأثير الأزواج الخاطئة الإيجابية (false positive pairs) مع الاستفادة بكفاءة من البنية الموجودة في فضاء الميزات المُدرّب مسبقًا. كنتيجة، نُحسّن دقة التجميع مقارنةً بخوارزمية kkk-means على 17 نموذجًا مُدرّبًا مسبقًا بنسبة 6.1% على ImageNet و12.2% على CIFAR100، على التوالي. وأخيرًا، باستخدام نماذج التحويل البصري ذاتية التدريب (self-supervised vision transformers)، نحقق دقة تجميع تبلغ 61.6% على ImageNet. يُمكن الوصول إلى الكود من خلال الرابط التالي: https://github.com/HHU-MMBS/TEMI-official-BMVC2023.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp