HyperAIHyperAI
منذ 17 أيام

شبكة عصبية متعددة الطبقات تُدمج في مرحلة متأخرة لقصّ الصور الرقمية

{ Weiwei Xu, Hujun Bao, Qixing Huang, Peiran Ren, Lubin Fan, Lixue Gong, Yunke Zhang}
شبكة عصبية متعددة الطبقات تُدمج في مرحلة متأخرة لقصّ الصور الرقمية
الملخص

تُدرس هذه الورقة بنية شبكة عصبية متعددة الطبقات باستخدام التحويلات التلافيفية العميقة للتنبؤ بقيمة ألفا الماتي للخلفية الأمامية باستعمال صورة RGB واحدة كمدخل. تعتمد الشبكة على هيكل كامل التحويل التلافيفي، وتضم فرعين مُفكَّكَين (Decoders) لتصنيف الخلفية والخلفية الأمامية على التوالي. ثم يُستخدم فرع تجميع (Fusion Branch) لدمج نتائج التصنيف الخاصة بكل من الخلفية والأمامية، مما ينتج قيم ألفا كنتيجة تجزئة لينة. يوفر هذا التصميم درجات حرية أكثر من استخدام فرع مُفكِّك واحد، ما يمكّن الشبكة من تحقيق قيم ألفا أفضل أثناء التدريب. كما تُنتج الشبكة بشكل ضمني خرائط تريما (Trimaps) دون تفاعل من المستخدم، مما يجعلها سهلة الاستخدام للمبتدئين الذين لا يمتلكون خبرة في تجزئة الصور الرقمية. وأظهرت النتائج التجريبية أن الشبكة قادرة على إنتاج ماتي ألفا عالي الجودة لتنوع كبير من الأنواع الكائنة، وتتفوّق على أحدث الطرق القائمة على الشبكات العصبية التلافيفية (CNN) في مهمة تجزئة الصور البشرية.

شبكة عصبية متعددة الطبقات تُدمج في مرحلة متأخرة لقصّ الصور الرقمية | أحدث الأوراق البحثية | HyperAI