HyperAI

Lipreading

القراءة من الشفاه هي عملية استخراج الكلام من خلال مراقبة حركة شفتي المتكلم في حالة الصمت. وهي عنصر مهم في التواصل البشري، خاصة بالنسبة للأشخاص الذين يعانون من ضعف السمع. تستخدم القراءة من الشفاه العميقة الشبكات العصبية العميقة لاستخراج الكلام من مقاطع الفيديو الصامتة، والتي تُعرف أيضًا باسم التعرف على الكلام البصري (VSR)، قراءة الشفاه الآلية، أو القراءة من الشفاه التلقائية. تتكون هذه العملية بشكل أساسي من مرحلتين: الأولى هي استخراج الخصائص البصرية والزمنية من سلسلة من إطارات الفيديو؛ والثانية هي معالجة هذه الخصائص إلى وحدات كلامية مثل الحروف، الكلمات، أو الجمل. يمكن تطبيق تقنية القراءة من الشفاه العميقة في مجالات متعددة، مما يعزز كفاءة التواصل وسهولة الوصول إليه.