HyperAIHyperAI

Command Palette

Search for a command to run...

تخمين ما يتحرك: تقسيم الفيديو والصور دون إشراف من خلال توقع الحركة

Subhabrata Choudhury* Laurynas Karazija* Iro Laina Andrea Vedaldi Christian Rupprecht

الملخص

الحركة، التي يتم قياسها عبر التدفق البصري (optical flow)، توفر إشارة قوية لاكتشاف وتعلم الأشياء في الصور والفيديوهات. ومع ذلك، مقارنة باستخدام المظهر (appearance)، فإنها لديها بعض النقاط العمياء، مثل حقيقة أن الأشياء تصبح غير مرئية إذا لم تتحرك. في هذا العمل، نقترح نهجًا يجمع بين نقاط القوة في تقسيم الأشياء بناءً على الحركة وبناءً على المظهر. نقترح إشراف شبكة تقسيم الصور بمهمة سابقة هي التنبؤ بالمناطق التي من المحتمل أن تحتوي على أنماط حركة بسيطة، وبالتالي من المحتمل أن تكون متناظرة مع أشياء. حيث يستخدم النموذج صورة واحدة فقط كمدخل، يمكن تطبيقه في حالين: تقسيم الفيديو بدون إشراف، وتقسيم الصور بدون إشراف. نحقق أفضل النتائج المتاحة حاليًا للفيديوهات ونثبت جدوى نهجنا على الصور الثابتة التي تحتوي على أشياء جديدة. بالإضافة إلى ذلك، نجري تجارب مع نماذج حركة مختلفة وأنوية التدفق البصري (optical flow backbones) ونجدها مقاومة لهذه التغييرات. صفحة المشروع والكود متوفرين على الرابط: https://www.robots.ox.ac.uk/~vgg/research/gwm.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp