Command Palette
Search for a command to run...
التمييز الدلالي المدرك للحالة من خلال سلاسل الشبكات متعددة المهام
التمييز الدلالي المدرك للحالة من خلال سلاسل الشبكات متعددة المهام
Dai Jifeng He Kaiming Sun Jian
الملخص
شهدت أبحاث التجزئة الدلالية تقدماً سريعاً في الآونة الأخيرة، لكن العديد من الأساليب الرائدة لا تتمكن من تحديد هويات الكائنات الفردية. في هذا البحث، نقدّم نموذجاً يُعرف بـ "السلاسل المتعددة المهام للشبكة" (Multi-task Network Cascades) لتحليل التجزئة الدلالية مع الوعي بالكائنات. يتكوّن نموذجنا من ثلاث شبكات، تُميّز كل منها على التوالي بين الكائنات الفردية، وتحدد أقنعة الكائنات، وتصنّف الكائنات. تُشكّل هذه الشبكات هيكلًا متسلسلاً (Cascaded)، وتم تصميمها لتشارك في الخصائص الاستدلالية المتعددة (التحفيزية) عبر الطبقات. ونُطوّر خوارزمية لتدريب هذا الهيكل المتسلسل السببي بطريقة منتظمة ومتسلسلة (end-to-end) لا تتطلب خطوات متعددة. ويُعدّ حلنا إطاراً تدريبياً نقياً وخطوة واحدة، ويمكن تعميمه على السلاسل التي تتضمن عددًا أكبر من المراحل. ونُظهر أداءً متفوّقًا على مستوى الحالة الحالية (state-of-the-art) في التجزئة الدلالية المُدركة للكائنات على مجموعة بيانات PASCAL VOC. وفي الوقت نفسه، يستغرق نموذجنا 360 مللي ثانية فقط لتحليل صورة واحدة باستخدام معمارية VGG-16، أي ما يعادل تقليلًا بمقدار مرّتين (أي تسعين مرة) في زمن المعالجة مقارنةً بالنظم السابقة التي تُعالج هذه المشكلة الصعبة. وبصفة ثانوية، يُحقّق النموذج نتائج مُقنعة في مهمة الكشف عن الكائنات، تفوق فيها الأنظمة التنافسية المعروفة بـ Fast/Faster R-CNN.يُعدّ الأسلوب المُقدّم في هذا البحث الأساس لتقديماتنا في مسابقة التجزئة ضمن مسابقة MS COCO 2015، حيث نجحنا في الفوز بالمركز الأول.