HyperAIHyperAI
منذ 2 أشهر

العمق المكاني: شبكات النيورونات المكانيّة العميقة لفهم مشاهد الحركة المرورية

Xingang Pan; Jianping Shi; Ping Luo; Xiaogang Wang; Xiaoou Tang
العمق المكاني: شبكات النيورونات المكانيّة العميقة لفهم مشاهد الحركة المرورية
الملخص

الشبكات العصبية المتشابكة (CNNs) تُبنى عادةً من خلال تراكيب العمليات المتشابكة طبقة بطبقة. رغم أن الشبكة العصبية المتشابكة (CNN) أظهرت قدرةً قويةً على استخراج الدلالات من البكسلات الخام، إلا أن قدرتها على التقاط العلاقات المكانية للبكسلات عبر الصفوف والأعمدة في صورة لم يتم استكشافها بشكل كامل. هذه العلاقات مهمة لتعلم الأشياء الدلالية ذات الأولويات الشكلية القوية ولكن التماسك الظاهري الضعيف، مثل خطوط المرور، والتي غالبًا ما تكون مغطاة أو حتى غير مرسومة على سطح الطريق كما هو موضح في الشكل 1 (أ). في هذا البحث، نقترح شبكات CNN المكانية (SCNN)، التي تعمم التشابكات العميقة الطبقة بطبقة التقليدية إلى تشابكات شريحة بشريحة داخل الخرائط الميزانية، مما يتيح تمرير الرسائل بين البكسلات عبر الصفوف والأعمدة في طبقة واحدة. تعتبر هذه الشبكات SCNN مناسبة بشكل خاص للأجسام المستمرة الطويلة أو الكائنات الكبيرة ذات العلاقة المكانية القوية ولكن الأدلة الظاهرة القليلة، مثل خطوط المرور، الأعمدة والجدار. نطبق SCNN على مجموعة بيانات جديدة وصعبة للغاية للكشف عن خطوط المرور وعلى مجموعة بيانات Cityscapes. تظهر النتائج أن SCNN يمكنها تعلم العلاقة المكانية للإخراج الهيكلي وتحسين الأداء بشكل كبير. نوضح أن SCNN أظهرت أداءً أفضل بنسبة 8.7% و4.6% على التوالي مقارنة بالشبكة العصبية المتكررة (RNN) المعتمدة ReNet ومزيج MRF+CNN (MRFNet) في مجموعة بيانات الكشف عن الخطوط. بالإضافة إلى ذلك، حازت شبكتنا SCNN على المركز الأول في تحدي TuSimple لقياس دقة الكشف عن خطوط المرور، بمعدل دقة بلغ 96.53%.

العمق المكاني: شبكات النيورونات المكانيّة العميقة لفهم مشاهد الحركة المرورية | أحدث الأوراق البحثية | HyperAI