HyperAIHyperAI

Command Palette

Search for a command to run...

اكتشاف متعدد الزوايا مع تحويل المنظور الخاص بالخصائص

Yunzhong Hou Liang Zheng Stephen Gould

الملخص

دمج عدّة زوايا كاميرا للكشف يخفف من تأثير التغطية في المشاهد المزدحمة. في نظام متعدد الزوايا، يجب الإجابة على سؤالين مهمين عند التعامل مع الغموض الناتج عن التغطية. الأول، كيف ينبغي لنا دمج المؤشرات من الزوايا المتعددة؟ الثاني، كيف ينبغي لنا دمج المعلومات المكانية غير الموثوقة ثنائية الأبعاد وثلاثية الأبعاد التي تأثرت بالتغطية؟ لمعالجة هذه الأسئلة، نقترح نظامًا جديدًا لكشف الزوايا المتعددة، يُسمى MVDet. بالنسبة لدمج الزوايا المتعددة، تقوم الطرق الحالية بدمج خصائص الصناديق المرجعية من المستوى الصوري، مما قد يحد من الأداء بسبب عدم دقة أشكال وأحجام الصناديق المرجعية. بالمقابل، نتبع نهجًا خاليًا من الصناديق المرجعية لدمج معلومات الزوايا المتعددة عبر إسقاط الخرائط المميزة على المستوى الأرضي (النظرة الطائرية). للتعامل مع أي غموض مكاني باقي، نطبق عمليات التواء ذات نواة كبيرة على خريطة الخصائص المستوى الأرضي ونستنتج المواقع من قمم الكشف. يتم تعلم نموذجنا بالكامل بطريقة نهاية إلى نهاية ويحقق نسبة MODA 88.2% على مجموعة بيانات Wildtrack القياسية، متفوقًا على أفضل التقنيات الحالية بنسبة 14.1%. كما نقدم تحليلًا مفصلًا لنظام MVDet على مجموعة بيانات جديدة مقدمة بشكل اصطناعي تُدعى MultiviewX، والتي تتيح لنا السيطرة على مستوى التغطية. يمكن الوصول إلى الرمز ومجموعة بيانات MultiviewX عبر الرابط: https://github.com/hou-yz/MVDet.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp