النسيج الاجتماعي: تركيبات التوبلت للكشف عن العلاقات في الفيديو

يسعى هذا البحث إلى تصنيف وتحديد العلاقة بين أنابيب الأشياء التي تظهر داخل الفيديو كثلاثي <موضوع-فعل-كائن>. بينما تتعامل الدراسات السابقة مع اقتراحات الأشياء أو الأنابيب ككيانات منفردة وتقوم بنمذجة علاقاتها بشكل لاحق، نقترح تصنيف وتحديد الأفعال لزوجين من أنابيب الأشياء بشكل مسبق. كما نقترح "النسيج الاجتماعي" (Social Fabric): وهو تمثيل يعبر عن زوج من أنابيب الأشياء كتركيب للعناصر التفاعلية الأولية. يتم تعلم هذه العناصر الأولية على جميع العلاقات، مما يؤدي إلى تمثيل مضغوط قادر على تحديد وتصنيف العلاقات من مجموعة الأنابيب المشتركة للأجسام عبر جميع فترات الزمن في الفيديو. يمكّن هذا الترميز شبكتنا ذات المرحلتين. في المرحلة الأولى، ندرب النسيج الاجتماعي على اقتراح علاقات محتملة. وفي المرحلة الثانية، نستخدم النسيج الاجتماعي لضبط وتنبؤ تسميات الأفعال للأنابيب بشكل متزامن. تُظهر التجارب فائدة نمذجة العلاقات المبكرة في الفيديو، بالإضافة إلى ترميزنا وهندستنا ذات المرحلتين، مما أدى إلى تحقيق مستوى جديد من الدقة في معياريْن. كما نوضح كيف يمكن لهذا الترميز تمكين البحث عن العلاقات الزمانية والمكانية في الفيديو باستخدام أمثلة العناصر الأولية.الرمز: https://github.com/shanshuo/Social-Fabric.