HyperAIHyperAI

Command Palette

Search for a command to run...

الفصل التفاعلي للأشياء في الفيديو: من التفاعل إلى القناع، الانتشار والتجميع مع الوعي بالاختلاف

Ho Kei Cheng Yu-Wing Tai Chi-Keung Tang

الملخص

نقدم إطار العمل التفاعلي المعياري VOS (MiVOS) الذي يفصل بين التفاعل إلى القناع وانتشار القناع، مما يسمح بقابلية تعميم أعلى وأداء أفضل. يتم تدريب الوحدة التفاعلية بشكل منفصل لتحويل التفاعلات المستخدم إلى قناع كائن، والذي يتم نشره زمنيًا بواسطة وحدة الانتشار الخاصة بنا باستخدام استراتيجية فلترة جديدة تُعرف بالفلترة الأعلى-kkk في قراءة ذاكرة الزمان والمكان. للأخذ الفعال في نوايا المستخدم، تم اقتراح وحدة جديدة تُعرف بوحدة الاختلاف المدركة لتعلم كيفية دمج القناع قبل وبعد كل تفاعل بشكل صحيح، والتي يتم محاذاتها مع الإطارات المستهدفة باستخدام ذاكرة الزمان والمكان. نقيم طريقة عملنا بشكل نوعي وكمي باستخدام أشكال مختلفة من التفاعلات المستخدم (مثل الرسومات العشوائية، النقرات) على DAVIS لإظهار أن طريقة عملنا تتفوق على الخوارزميات الأكثر تقدمًا حاليًا بينما تتطلب عددًا أقل من التفاعلات الإطارية، مع ميزة إضافية في التعميم إلى أنواع مختلفة من التفاعلات المستخدم. نساهم بقاعدة بيانات VOS الاصطناعية الضخمة التي تحتوي على تقسيم دقيق للبكسل لـ 4.8 مليون إطار لتكون مرافقةً لأكواد المصدر الخاصة بنا تسهل البحث المستقبلي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp