HyperAI

Video Visual Relation Detection

اكتشاف العلاقات البصرية في الفيديو (VidVRD) هو جزء فرعي من مجال الرؤية الحاسوبية يهدف إلى اكتشاف حالات العلاقات البصرية المطلوبة في الفيديوهات. يتم تمثيل كل حالة بثلاثي علاقة <موضوع، فعل، كائن> ومسارها. مقارنة بالصور الثابتة، توفر الفيديوهات خصائص ديناميكية ومتغيرة زمنيًا، مما يساعد على التقاط علاقات بصرية أكثر طبيعية. ومع ذلك، بسبب متطلبات الدقة العالية لتتبع الأشياء وتنوع تمثيلات العلاقات، فإن VidVRD أكثر صعوبة تقنيًا من اكتشاف العلاقات البصرية في الصور الثابتة. تكمن قيمة هذا المهمة التطبيقية في قدرتها على فهم محتوى الفيديو بشكل أعمق، مما يدعم التحليل المتقدم للمشهد والتقدير الدقيق للأفعال.