HyperAIHyperAI

Command Palette

Search for a command to run...

التعلم غير المشرف المحرك بالكفاءة الكهرومغناطيسية لتقسيم الحركة بشكل فعال

Etienne Meunier; Anaïs Badoual; Patrick Bouthemy

الملخص

في هذا البحث، نقدم طريقة غير مراقبة بالكامل تعتمد على الشبكات العصبية المُعَمَّقة القائمة على التعلم العميق (CNN) لتقسيم الحركة من خلال التدفق البصري. نفترض أن التدفق البصري المدخل يمكن تمثيله كمجموعة قطعية من نماذج الحركة المعلمية، مثل النماذج الافينية أو التربيعية. الفكرة الأساسية لعملنا هي الاستفادة من إطار العمل توقع-تعظيم (EM) لتصميم دالة خسارة وإجراء تدريب شبكتنا العصبية لتقسيم الحركة بطريقة مُؤَسَّسة جيدًا ولا تتطلب إما بيانات حقيقية أو تسميات يدوية. ومع ذلك، بخلاف الطريقة التقليدية للـ EM التكرارية، بمجرد تدريب الشبكة، يمكننا تقديم تقسيم لأي حقل تدفق بصري غير معروف في خطوة استدلال واحدة دون تقدير أي نماذج حركة. ندرس دوال خسارة مختلفة، بما في ذلك تلك الدوال المتينة، ونقترح تقنية توسيع البيانات الكفوءة الجديدة التي يمكن تطبيقها على أي شبكة تستقبل التدفق البصري كمدخل. بالإضافة إلى ذلك، يتم تصميم طرقنا لتتمكن من تقسيم عدة حركات. تم اختبار شبكتنا لتقسيم الحركة على أربعة مقاييس مرجعية هي DAVIS2016 وSegTrackV2 وFBMS59 وMoCA، وأظهرت أداءً ممتازًا بينما كانت سريعة أثناء الاختبار.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp