HyperAIHyperAI

Command Palette

Search for a command to run...

Occlusion-Net: التعرف على المواقع المُحجبَة ثنائية وثلاثية الأبعاد باستخدام الشبكات الرسومية

Srinivasa G. Narasimhan Minh Vo N. Dinesh Reddy

الملخص

نقدم "Occlusion-Net"، إطارًا لتنبؤ بمواقع النقاط المفتاحية المُغطاة ثنائيَّة وثلاثية الأبعاد للأشياء، بطريقة مُتعددة التلقائية إلى حد كبير. نستخدم كمدخل كاشفًا جاهزًا (مثل MaskRCNN) تم تدريبه فقط على تسميات النقاط المفتاحية المرئية، وهي الوحيدة من أنواع الإشراف المستخدمة في هذه الدراسة. ثم يُستخدم شبكة مشفرة للرسم البياني (graph encoder) لتصنيف الحواف غير المرئية بشكل صريح، بينما تقوم شبكة فك التشفير للرسم البياني (graph decoder) بتصحيح مواقع النقاط المفتاحية المغطاة بناءً على النتائج الأولية من الكاشف. وتشكل خسارة التنسور الثلاثي (trifocal tensor loss) العمود الفقري لهذه الدراسة، حيث توفر إشرافًا ذاتيًا غير مباشر لمواقع النقاط المفتاحية المغطاة التي تكون مرئية في وجهات نظر أخرى للجسم. ثم تُمرّر النقاط الثنائية الأبعاد عبر شبكة رسم بياني ثلاثية الأبعاد، والتي تُقدّر الشكل ثلاثي الأبعاد ووضع الكاميرا باستخدام خسارة إعادة التصوير ذاتية التدريب. عند التشغيل، يتمكن نهجنا بنجاح من تحديد مواقع النقاط المفتاحية في رؤية واحدة تحت مجموعة متنوعة من ظروف الإغلاق الشديد. ونُظهر ونُقيّم نهجنا على بيانات محاكاة CAD، وكذلك على مجموعة كبيرة من الصور التي تُظهر المركبات في العديد من التقاطعات المزدحمة بالمدن. كمعلومة جانبية مثيرة للاهتمام، نقارن دقة التسميات البشرية للنقاط المفتاحية غير المرئية مع تلك الناتجة عن خسارة التنسور الثلاثي الهندسي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
Occlusion-Net: التعرف على المواقع المُحجبَة ثنائية وثلاثية الأبعاد باستخدام الشبكات الرسومية | مستندات | HyperAI