HyperAIHyperAI

Command Palette

Search for a command to run...

شبكة الانتباه الذاتي الهرمية لتحديد المواقع الفعلية في الفيديوهات

Wen-Hsien Fang Yie-Tarng Chen Rizard Renanda Adhi Pramono

الملخص

يقدم هذا البحث شبكة انتباه ذاتي هيراركية جديدة (HISAN) لإنشاء أنابيب فضائية-زمنية لتحديد موقع الأفعال في الفيديوهات. ويتمثّل جوهر HISAN في دمج الشبكة العصبية التلافيفية ذات التدفق المزدوج (CNN) مع آلية انتباه ذاتي ثنائي الاتجاه الهيراركية، والتي تتضمّن مستويين من الانتباه الذاتي الثنائي الاتجاه، بهدف التقاط المعلومات المتعلقة بالاعتماد الزمني الطويل والاتصال المكاني بكفاءة، مما يُسهم في تحسين دقة تحديد موقع الأفعال. بالإضافة إلى ذلك، تم استخدام خوارزمية إعادة تقييم التسلسل (SR) لحل المشكلة الناتجة عن التقييمات غير الموافقة في الكشف الناتجة عن التغطية أو التشويش الخلفي. علاوةً على ذلك، تم اعتماد خطة دمج جديدة تدمج ليس فقط معلومات المظهر والحركة من الشبكة ذات التدفق المزدوج، بل أيضًا معلومات البارزة في الحركة، للتقليل من تأثير حركة الكاميرا. وأظهرت المحاكاة أن النهج الجديد يحقق أداءً تنافسيًا مع أحدث الأعمال في مجال دقة تحديد موقع الأفعال والتقدير الدقيق لها على مجموعتي بيانات واسعتي الانتشار UCF101-24 وJ-HMDB.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp