HyperAIHyperAI

Command Palette

Search for a command to run...

CMT-DeepLab: تجميع تحويلات الأقنعة للفصل الشامل

Qihang Yu Huiyu Wang Dahun Kim Siyuan Qiao Maxwell Collins Yukun Zhu Hartwig Adam Alan Yuille Liang-Chieh Chen

الملخص

نُقدّم إطار عمل Clustering Mask Transformer (CMT-DeepLab)، وهو إطار مبني على المحولات (transformer) للتصنيف الشامل (panoptic segmentation)، مصمم حول مفهوم التجميع (clustering). يعيد هذا الإطار النظر في الهياكل الحالية للمحولات المستخدمة في التصنيف والكشف عن الكائنات، حيث يُعامل استفسارات الكائن (object queries) كمراكز تجميع، والتي تقوم بدور تجميع البكسلات عند تطبيقها على المهمة التصنيفية. يتم حساب التجميع من خلال عملية متكررة، تبدأ بتعيين البكسلات إلى المجموعات بناءً على تشابه خصائصها، ثم تحديث مراكز المجموعات وخصائص البكسلات. معًا، تشكّل هذه العمليات طبقة Clustering Mask Transformer (CMT)، التي تُنتج انتباهًا متقاطعًا (cross-attention) أكثر كثافة وتماشيًا مع المهمة النهائية للتصنيف. يُحسّن CMT-DeepLab الأداء بشكل كبير مقارنة بالأساليب السابقة بنسبة 4.4% في مؤشر PQ، محققًا حالة جديدة من التميز بتحقيق 55.7% PQ على مجموعة اختبار COCO test-dev.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp