HyperAIHyperAI
منذ 18 أيام

طريقة هرمية قابلة للتوسع للكشف عن التصرفات التفاعلية لفهم الفيديو

{Junho Jin, Jinyoung Moon, Yongjin Kwon, Kyuchang Kang, Kyoung Park, Jongyoul Park}
الملخص

بالنسبة لفهم الفيديو، أي تحليل من قام بأي فعل في فيديو، تُعد الحركات مع الكائنات العناصر الأساسية. وقد ركّزت معظم الدراسات المتعلقة بالحركات على مشكلات التعرف في مقاطع فيديو مُعدّة مسبقًا، مع التركيز على تحسين أداء التصنيف. ومع ذلك، يُطلب اكتشاف الحركات، بما في ذلك التحديد المكاني والزمني، لأن الحركات عادةً ما تتداخل في الزمن والمكان. علاوةً على ذلك، لم تأخذ معظم الدراسات بعين الاعتبار قابلية التوسعة عند إضافة حركة جديدة لم تُدرَّس سابقًا. لذلك، يُقدّم هذا البحث منهجًا هرميًا قابلاً للتوسعة لاكتشاف الحركات العامة، والذي يدمج حركات الكائنات والعلاقات المكانية بين كائنين، إلى جانب الحركات الموروثة التي تُحدّد من خلال الكائنات المرتبطة باستخدام منهجية قائمة على الأونتولوجيا والقواعد. يُتيح التصميم الهرمي للمنهج اكتشاف أي حركات تفاعلية بناءً على العلاقات المكانية بين كائنين. ويحقق المنهج الذي يستخدم معلومات الكائنات قياسًا F يبلغ 90.27٪. علاوةً على ذلك، يصف هذا البحث قابلية التوسعة للمنهج في حالة وجود حركة جديدة ضمن فيديو من مجال فيديو مختلف عن مجموعة البيانات المستخدمة.