Xception: التعلم العميق باستخدام التحويلات المنفصلة العميقة

نقدّم تفسيرًا لوحدات Inception في الشبكات العصبية التلافيفية على أنها خطوة وسيطة بين الت convolution العادي وعملية الت convolution المنفصلة عمقًا (أي convolution عمقية تتبعها convolution نقطة). وبهذا السياق، يمكن فهم الت convolution المنفصلة عمقًا على أنها وحدة Inception تمثل عددًا أقصى من البرج (towers). يستند هذا الملاحظة إلى اقتراح معمّق جديد لتصميم شبكة عصبية تلافيفية عميقة مستوحى من مفهوم Inception، حيث تم استبدال وحدات Inception بـ convolution المنفصلة عمقًا. ونُظهر أن هذا التصميم، المُسمّى Xception، يتفوّق قليلاً على Inception V3 في مجموعة بيانات ImageNet (التي صُمّمت خصيصًا لـ Inception V3)، كما يتفوّق بشكل ملحوظ على Inception V3 في مجموعة بيانات تصنيف صور أكبر تضم 350 مليون صورة و17,000 فئة. وبما أن معمارية Xception تحتوي على نفس عدد المعلمات كما Inception V3، فإن تحسّن الأداء لا يعود إلى زيادة القدرة التقديرية، بل إلى استخدام أكثر كفاءة للمعلمات النموذجية.