HyperAIHyperAI

Command Palette

Search for a command to run...

شبكة العلاقة بين الممثل والسياق والممثل لتحديد موقع الحركة المكانية والزمانية

Junting Pan Siyu Chen Mike Zheng Shou Yu Liu Jing Shao Hongsheng Li

الملخص

تحديد الأشخاص وتعرف على أفعالهم من الفيديوهات هو مهمة صعبة نحو فهم الفيديو على مستوى عالٍ. تم تحقيق تقدم كبير مؤخرًا من خلال نمذجة العلاقات الزوجية المباشرة بين الكيانات. في هذا البحث، نخطو خطوة إضافية، حيث لا نقوم فقط بنمذجة العلاقات المباشرة بين الأزواج بل نأخذ أيضًا في الاعتبار العلاقات غير المباشرة من الرتب العليا التي تُبنى على عدة عناصر. نقترح نمذجة العلاقة بين الممثل-السياق-الممثل (Actor-Context-Actor Relation)، وهي العلاقة بين ممثلين اثنين استنادًا إلى تفاعلاتهما مع السياق. لهذا الغرض، قمنا بتصميم شبكة علاقة الممثل-السياق-الممثل (ACAR-Net) التي تعتمد على مشغل جديد لنمذجة العلاقات من الرتب العليا وبنك خصائص الممثل-السياق لتمكين التفكير في العلاقات غير المباشرة لتحديد الأفعال الزمانية والمكانية. أظهرت التجارب على مجموعات البيانات AVA و UCF101-24 مزايا نمذجة علاقات الممثل-السياق-الممثل، وتأكد ذلك بشكل أكبر من خلال تصور خرائط الانتباه التي أكدت أن نموذجنا قادر على العثور على علاقات ذات رتب عليا ذات صلة لدعم كشف الأفعال. يُذكر أن طريقة عملنا حازت على المركز الأول في مهمة تحديد موقع الأفعال AVA-Kinetics ضمن تحدي ActivityNet 2020، متقدمةً بشكل كبير على باقي المشاركات (+6.71mAP). سيتم توفير شفرة التدريب والنماذج في الرابط https://github.com/Siyu-C/ACAR-Net.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp