HyperAIHyperAI

Command Palette

Search for a command to run...

التجزئة الزمنية: نهج موحد لتحليل الفيديو

Dotan Kaufman extsuperscript1 Gil Levi extsuperscript1 Tal Hassner extsuperscript2,3 Lior Wolf extsuperscript1,4

الملخص

نقدم نهجًا عامًا لفهم الفيديو، مستوحى من تقنيات النقل الدلالي التي تم استخدامها بنجاح في تحليل الصور ثنائية الأبعاد. يتناول أسلوبنا الفيديو كمتتابعة أحادية البعد من المقاطع، كل منها مرتبط بدلالته الخاصة. طبيعة هذه الدلالات - العبارات اللغوية الطبيعية أو التسميات الأخرى - تعتمد على المهمة المعنية. يتم معالجة فيديو الاختبار عن طريق إنشاء علاقات بين مقاطعه ومقاطع الفيديوهات المرجعية ذات الدلالات المعروفة، ثم يمكن نقل دلالات الفيديوهات المرجعية إلى فيديو الاختبار. نصفّ نوعين من طرق التطابق، وكلاهما مصمم لضمان أن (أ) تبدو المقاطع المرجعية مشابهة لمقاطع الاختبار وأن (ب) مجتمعةً، تكون دلالات المقاطع المرجعية المختارة متسقة وتحافظ على التجانس الزمني. نستخدم أسلوبنا في كتابة توضيحات للفيديو على معيار LSMDC'16، وفي تلخيص الفيديو على معايير SumMe وTVSum، وفي اكتشاف الأفعال الزمنية على معيار Thumos2014، وفي التنبؤ بالصوت على معيار Greatest Hits. لا يفوق أسلوبنا الحالة الراهنة فحسب في أربعة من خمسة معايير، بل هو أيضًا الطريقة الوحيدة التي نعرفها والتي تم تطبيقها بنجاح على مجموعة متنوعة ومختلفة من المهام.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التجزئة الزمنية: نهج موحد لتحليل الفيديو | مستندات | HyperAI