HyperAIHyperAI
منذ 4 أشهر

أوسع أو أعمق: إعادة النظر في نموذج ResNet للتعرف البصري

Zifeng Wu; Chunhua Shen; Anton van den Hengel
أوسع أو أعمق: إعادة النظر في نموذج ResNet للتعرف البصري
الملخص

الاتجاه نحو الشبكات العصبية المتعمقة بشكل متزايد قد تم دفعه من خلال الملاحظة العامة التي تفيد بأن زيادة العمق تزيد من أداء الشبكة. ومع ذلك، فقد تراكمت مؤخرًا الأدلة على أن زيادة العمق ببساطة قد لا تكون أفضل طريقة لزيادة الأداء، خاصة في ضوء القيود الأخرى. كما أشارت الدراسات حول الشبكات العصبية المتبقية العميقة إلى أنها قد لا تعمل في الواقع كشبكة عميقة واحدة، بل كمجموعة من شبكات عميقة نسبيًا. نقوم بفحص هذه القضايا، وفي هذا السياق نصل إلى تفسير جديد للرؤية المنفصل للشبكات العصبية المتبقية العميقة يشرح بعض السلوكيات التي تم ملاحظتها تجريبيًا. نتيجة لذلك، نتمكن من اشتقاق هندسة جديدة وأقل عمقًا للشبكات المتبقية والتي تتفوق بشكل كبير على النماذج الأكثر عمقًا مثل ResNet-200 في مجموعة بيانات تصنيف ImageNet. كما نظهر أن هذا الأداء قابل للنقل إلى مجالات مشكلات أخرى من خلال تطوير نهج للفصل الدلالي (semantic segmentation) الذي يتفوق على أفضل التقنيات الحالية بمقدار ملحوظ في مجموعات بيانات مثل PASCAL VOC و PASCAL Context و Cityscapes. وبالتالي,则该提议的架构不仅在性能上超越了其竞争对手,包括非常深的残差网络(ResNets),而且在内存使用方面更加高效,有时在训练时间上也是如此。代码和模型可在 https://github.com/itijyou/ademxapp 获取。请注意,最后一句中“则该提议的架构不仅在性能上超越了其竞争对手,包括非常深的残差网络(ResNets),而且在内存使用方面更加高效,有时在训练时间上也是如此。”被翻译为:وبالتالي، فإن الهيكلة المقترحة تتفوق على مقارنتها، بما في ذلك الشبكات المتبقية ذات العمق الكبير (ResNets)، وهي أكثر كفاءة في استخدام الذاكرة وأحيانًا أيضًا في وقت التدريب.希望这符合您的要求。如果您有任何其他问题或需要进一步修改,请随时告知我。