HyperAIHyperAI

Command Palette

Search for a command to run...

بيتا ر-سي أن: النظر في الكشف عن المشاة من منظور آخر

Zixuan Xu Banghuai Li Ye Yuan Anhong Dang

الملخص

تم تحقيق تقدم كبير مؤخرًا في كشف المشاة، إلا أن تحقيق أداء عالٍ في المشاهد المزدحمة والمشاهد التي تشهد تداخلًا (تغطية جزئية) لا يزال يمثل تحديًا كبيرًا. ويمكن تفسير هذا التحدي في المقام الأول بالتمثيل الشائع المستخدم للمشاة، وهو المربع المحيط بمحاذاة محوري 2D، والذي يصف فقط الموقع التقريبي والحجم الكلي للجسم. حيث يُمثّل هذا المربع الجسم كتوزيع منتظم داخل حدوده، مما يجعل المشاة غير قابلين للتمييز في المشاهد المزدحمة أو المغطاة جزئيًا بسبب وجود ضجيج كبير. وللتغلب على هذه المشكلة، نقترح تمثيلًا جديدًا يعتمد على التوزيع البيتا ثنائي الأبعاد، ويُسمّى تمثيل البيتا (Beta Representation). يُصوّر هذا التمثيل المشاة من خلال بناء علاقة صريحة بين المربع المحيط الكامل والمربع المرئي، مع التركيز على مركز الكتلة البصرية من خلال تخصيص قيم احتمالية مختلفة للبكسلات. وبذلك، يُظهر تمثيل البيتا أداءً أفضل بكثير في التمييز بين الكائنات المتشابكة بشدة في المشاهد المزدحمة، وذلك بفضل استراتيجية جديدة لـ NMS تُسمّى BetaNMS. علاوةً على ذلك، للاستفادة الكاملة من تمثيل البيتا، تم اقتراح مسار جديد يُدعى Beta R-CNN، مزودًا بـ BetaHead وBetaMask، مما يؤدي إلى أداء عالٍ في كشف المشاة في المشاهد المغطاة جزئيًا أو المزدحمة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
بيتا ر-سي أن: النظر في الكشف عن المشاة من منظور آخر | مستندات | HyperAI