HyperAIHyperAI

Command Palette

Search for a command to run...

التمييز الدلالي المدرك للحالة من خلال سلاسل الشبكات متعددة المهام

Dai Jifeng He Kaiming Sun Jian

الملخص

شهدت أبحاث التجزئة الدلالية تقدماً سريعاً في الآونة الأخيرة، لكن العديد من الأساليب الرائدة لا تتمكن من تحديد هويات الكائنات الفردية. في هذا البحث، نقدّم نموذجاً يُعرف بـ "السلاسل المتعددة المهام للشبكة" (Multi-task Network Cascades) لتحليل التجزئة الدلالية مع الوعي بالكائنات. يتكوّن نموذجنا من ثلاث شبكات، تُميّز كل منها على التوالي بين الكائنات الفردية، وتحدد أقنعة الكائنات، وتصنّف الكائنات. تُشكّل هذه الشبكات هيكلًا متسلسلاً (Cascaded)، وتم تصميمها لتشارك في الخصائص الاستدلالية المتعددة (التحفيزية) عبر الطبقات. ونُطوّر خوارزمية لتدريب هذا الهيكل المتسلسل السببي بطريقة منتظمة ومتسلسلة (end-to-end) لا تتطلب خطوات متعددة. ويُعدّ حلنا إطاراً تدريبياً نقياً وخطوة واحدة، ويمكن تعميمه على السلاسل التي تتضمن عددًا أكبر من المراحل. ونُظهر أداءً متفوّقًا على مستوى الحالة الحالية (state-of-the-art) في التجزئة الدلالية المُدركة للكائنات على مجموعة بيانات PASCAL VOC. وفي الوقت نفسه، يستغرق نموذجنا 360 مللي ثانية فقط لتحليل صورة واحدة باستخدام معمارية VGG-16، أي ما يعادل تقليلًا بمقدار مرّتين (أي تسعين مرة) في زمن المعالجة مقارنةً بالنظم السابقة التي تُعالج هذه المشكلة الصعبة. وبصفة ثانوية، يُحقّق النموذج نتائج مُقنعة في مهمة الكشف عن الكائنات، تفوق فيها الأنظمة التنافسية المعروفة بـ Fast/Faster R-CNN.يُعدّ الأسلوب المُقدّم في هذا البحث الأساس لتقديماتنا في مسابقة التجزئة ضمن مسابقة MS COCO 2015، حيث نجحنا في الفوز بالمركز الأول.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp