HyperAIHyperAI

Command Palette

Search for a command to run...

التعرف المستمر على لغة الإشارة من خلال التوافق عبر الوسائط لتمثيلات الفيديو والنصوص في فضاء مختلط مُشترك

Petros Daras DIMITRIOS KONSTANTINIDIS Kosmas Dimitropoulos Ilias Papastratis

الملخص

تمثّل الاعتراف المستمر بلغة الإشارة (CSLR) المشكلة الصعبة المتعلقة باستشعار كلمات لغة الإشارة وحدودها الزمنية من تسلسلات فيديو مُعلّمة بشكل ضعيف. ركّزت الطرق السابقة بشكل أساسي على استخلاص الميزات البصرية، مع تجاهل المعلومات النصية، وفشلها في نمذجة الاعتماديات الداخلية داخل الكلمة (intra-gloss dependencies) بشكل فعّال. في هذا العمل، تم اقتراح منهجية تعلم عبر الوسائط (cross-modal learning) تستخدم المعلومات النصية لتحسين أداء الاعتراف المستمر بلغة الإشارة القائمة على البصريات. ولتحقيق ذلك، تم استخدام شبكتين قويتين لترميز (encoding networks) في البداية لإنتاج تمثيلات (embeddings) للفيديو والنص، قبل تحويلها ومحاذاةً إلى تمثيل مشترك في الفضاء الخفي. ويهدف التماثل عبر الوسائط المقترح إلى نمذجة الاعتماديات الداخلية داخل الكلمة، وإنشاء تمثيلات خفية مبنية على الفيديو أكثر وصفًا لتحسين مهام CSLR. يتم تدريب المنهجية المقترحة بشكل مشترك باستخدام التمثيلات الخفية للفيديو والنص. وأخيرًا، يتم تصنيف التمثيلات الخفية المُحاذاة للفيديو باستخدام مشفر (decoder) تم تدريبه بشكل مشترك. وقد أظهرت التجارب الواسعة على ثلاث مجموعات بيانات معروفة لاعتراف بلغة الإشارة، مقارنة مع الطرق الرائدة حاليًا، الإمكانات الكبيرة التي يمتلكها النهج المقترح.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التعرف المستمر على لغة الإشارة من خلال التوافق عبر الوسائط لتمثيلات الفيديو والنصوص في فضاء مختلط مُشترك | مستندات | HyperAI