CTRN: شبكة ارتباطية فئوية-زمنية للكشف عن السلوك

كشف الحركات يُعد مهمة أساسية وصعبة، خاصةً بالنسبة لمجموعات البيانات المُعلمة بكثافة من مقاطع الفيديو غير المُختصرة. تواجه هذه المجموعات العديد من التحديات الواقعية، مثل الحركات المركبة، والتحركات المتزامنة، والتغير الزمني العالي في مدة تنفيذ كل مثال. وللتعامل مع هذه التحديات، نقترح استكشاف العلاقة بين الفئة والزمن بالنسبة للحركات المكتشفة. في هذا العمل، نقدم شبكة نهائية: الشبكة العلاقية الفئوية-الزمنية (CTRN). وتتألف من ثلاث مكونات رئيسية: (1) وحدة تحويل التمثيل تقوم بتصفية الميزات الخاصة بالفئة من التمثيلات المختلطة لبناء بيانات ذات هيكل رسم بياني. (2) وحدة الفئة-الزمنية تقوم بنمذجة العلاقات الفئوية والزمنية بطريقة تسلسلية. (3) فاصل G يعتمد على المعرفة المُفضلة الخاصة بأزواج الحركات المتزامنة على مستوى القطعة (snippet) لتحسين إمكانية اكتشاف الحركات المتزامنة بشكل أكبر. وقد قمنا بتقييم CTRN على ثلاث مجموعات بيانات صعبة مُعلمة بكثافة، وحققنا أداءً متميزًا مقارنة بالطرق الحالية، مما يعكس فعالية وقوة مقاومة طريقة العمل لدينا.