HyperAIHyperAI
منذ 2 أشهر

التعلم غير المشرف المحرك بالكفاءة الكهرومغناطيسية لتقسيم الحركة بشكل فعال

Etienne Meunier; Anaïs Badoual; Patrick Bouthemy
التعلم غير المشرف المحرك بالكفاءة الكهرومغناطيسية لتقسيم الحركة بشكل فعال
الملخص

في هذا البحث، نقدم طريقة غير مراقبة بالكامل تعتمد على الشبكات العصبية المُعَمَّقة القائمة على التعلم العميق (CNN) لتقسيم الحركة من خلال التدفق البصري. نفترض أن التدفق البصري المدخل يمكن تمثيله كمجموعة قطعية من نماذج الحركة المعلمية، مثل النماذج الافينية أو التربيعية. الفكرة الأساسية لعملنا هي الاستفادة من إطار العمل توقع-تعظيم (EM) لتصميم دالة خسارة وإجراء تدريب شبكتنا العصبية لتقسيم الحركة بطريقة مُؤَسَّسة جيدًا ولا تتطلب إما بيانات حقيقية أو تسميات يدوية. ومع ذلك، بخلاف الطريقة التقليدية للـ EM التكرارية، بمجرد تدريب الشبكة، يمكننا تقديم تقسيم لأي حقل تدفق بصري غير معروف في خطوة استدلال واحدة دون تقدير أي نماذج حركة. ندرس دوال خسارة مختلفة، بما في ذلك تلك الدوال المتينة، ونقترح تقنية توسيع البيانات الكفوءة الجديدة التي يمكن تطبيقها على أي شبكة تستقبل التدفق البصري كمدخل. بالإضافة إلى ذلك، يتم تصميم طرقنا لتتمكن من تقسيم عدة حركات. تم اختبار شبكتنا لتقسيم الحركة على أربعة مقاييس مرجعية هي DAVIS2016 وSegTrackV2 وFBMS59 وMoCA، وأظهرت أداءً ممتازًا بينما كانت سريعة أثناء الاختبار.

التعلم غير المشرف المحرك بالكفاءة الكهرومغناطيسية لتقسيم الحركة بشكل فعال | أحدث الأوراق البحثية | HyperAI