HyperAIHyperAI

Command Palette

Search for a command to run...

ملفّـكودر: رأس تصنيف قابل للتوسيع ومتنوع

Tal Ridnik* Gilad Sharir* Avi Ben-Cohen Emanuel Ben-Baruch Asaf Noy

الملخص

في هذا البحث، نقدم ML-Decoder، وهو رأس تصنيف جديد يعتمد على الانتباه (attention). يقوم ML-Decoder بتوقع وجود العلامات الفئوية من خلال الاستعلامات (queries)، مما يتيح استخدام أفضل للبيانات المكانية مقارنة بعمليات التجميع المتوسط العالمي (global average pooling). من خلال إعادة تصميم هندسة المفكك (decoder architecture) واستخدام نظام تفكيك مجموعات جديد (novel group-decoding scheme)، فإن ML-Decoder فعال للغاية ويمكنه التوسع بشكل جيد إلى آلاف الفئات. بالمقارنة مع استخدام هيكل أساسي أكبر (larger backbone)، يوفر ML-Decoder توازنًا أفضل بين السرعة والدقة بشكل مستمر. كما أن ML-Decoder متعدد الاستخدامات - يمكن استخدامه كبديل مباشر لرؤوس التصنيف المختلفة، ويتم عامته إلى فئات غير مشاهدة عند العمل مع استعلامات الكلمات (word queries). تحسن الاستعلامات الجديدة المستندة إلى الاستعلام (novel query augmentations) قدرته على التعميم بشكل إضافي. باستخدام ML-Decoder، حققنا نتائج في الطليعة في عدة مهام تصنيف: على MS-COCO للتصنيف متعدد العلامات، وصلنا إلى 91.4% mAP؛ وعلى NUS-WIDE للتصنيف الصفر-القطري (zero-shot)، وصلنا إلى 31.1% ZSL mAP؛ وعلى ImageNet للتصنيف الأحادي العلامة، حققنا درجة قمة جديدة بلغت 80.7% باستخدام هيكل ResNet50 الأساسي البسيط دون بيانات إضافية أو تقطير (distillation). الرمز العام متاح على الرابط التالي: https://github.com/Alibaba-MIIL/ML_Decoder


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
ملفّـكودر: رأس تصنيف قابل للتوسيع ومتنوع | مستندات | HyperAI