HyperAIHyperAI
منذ 2 أشهر

شبكات CNN الثنائية الهرمية لتحديد المواقع الرئيسية مع الموارد المحدودة

Adrian Bulat; Georgios Tzimiropoulos
شبكات CNN الثنائية الهرمية لتحديد المواقع الرئيسية مع الموارد المحدودة
الملخص

هدفنا تصميم هياكلات تحتفظ بالأداء الثوري للشبكات العصبية المتشابكة (Convolutional Neural Networks - CNNs) في تحديد المعالم، وفي الوقت نفسه تكون خفيفة الوزن ومدمجة ومناسبة لتطبيقات ذات موارد حاسوبية محدودة. لتحقيق هذا الهدف، نقدم المساهمات التالية:(أ) نحن أول من درس تأثير ثنائية الشبكات العصبية على مهام تحديد المعالم، مثل تقدير وضع الجسم البشري ومحاذاة الوجه. قمنا بتقييم شامل لخيارات التصميم المختلفة، وتحديد نقاط الاختناق في الأداء، وأهم من ذلك اقترحنا طرقًا متعددة ومتعامدة لتعزيز الأداء.(ب) بناءً على تحليلنا، نقترح هيكلاً جديدًا متدرجًا ومتوازيًا ومعالجًا متعدد المقاييس يحقق تحسينات كبيرة في الأداء مقارنة بالكتلة النموذجية التقليدية مع الحفاظ على نفس عدد المعلمات، مما يضيق الفجوة بين الشبكة الأصلية ونظيرتها الثنائية.(ج) نقوم بعدد كبير من دراسات الإلغاء الجزئي التي تلقي الضوء على خصائص وأداء الكتلة المقترحة.(د) نقدم نتائج للتجارب التي أجريت على أكثر قواعد البيانات صعوبة في تقدير وضع الجسم البشري ومحاذاة الوجه، حيث نبلغ في العديد من الحالات أداءً رائدًا على مستوى العالم.(هـ) بالإضافة إلى ذلك، نوفر نتائج إضافية للمشكلة المتعلقة بتمييز أجزاء الوجه. يمكن تنزيل الكود من الرابط التالي: https://www.adrianbulat.com/binary-cnn-landmark

شبكات CNN الثنائية الهرمية لتحديد المواقع الرئيسية مع الموارد المحدودة | أحدث الأوراق البحثية | HyperAI