HyperAIHyperAI

Command Palette

Search for a command to run...

شبكات SpotFast مع مُحوّلات جانبية مُعززة بالذاكرة للقراءة الشفوية

Peratham Wiriyathammabhum

الملخص

تقدم هذه الورقة معمارية جديدة للتعلم العميق لقراءة الشفاه على مستوى الكلمة. تشير الدراسات السابقة إلى إمكانية دمج شبكات عصبية تلافيفية ثلاثية الأبعاد عميقة مُدرَّبة مسبقًا كمُستخرج ميزات في المرحلة الأولى. نُقدّم شبكة SpotFast، وهي نسخة معدلة من شبكات SlowFast المتطورة حاليًا لتمييز الحركات، والتي تستخدم نافذة زمنية كمسار "نقطي" (spot pathway) وجميع الإطارات كمسار "سريع" (fast pathway). بالإضافة إلى ذلك، نُدمج محولات جانبية مُزوَّدة بذاكرة لتعلم الميزات التسلسلية من أجل التصنيف. قُمنا بتقييم النموذج المقترح على مجموعة بيانات LRW، وأظهرت التجارب أن النموذج المُقترح يتفوّق على العديد من النماذج المتطورة حاليًا، كما أن دمج المحولات الجانبية المُزوَّدة بذاكرة يُحقّق تحسنًا بنسبة 3.7% في أداء شبكة SpotFast.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
شبكات SpotFast مع مُحوّلات جانبية مُعززة بالذاكرة للقراءة الشفوية | مستندات | HyperAI