Lipreading
La lecture labiale est un processus consistant à extraire le discours en observant les mouvements des lèvres d'un locuteur dans un état silencieux. Elle est une composante importante de la communication humaine, particulièrement précieuse pour les personnes ayant une déficience auditive. La lecture labiale profonde utilise des réseaux neuronaux profonds pour extraire le discours à partir de vidéos silencieuses, également connue sous le nom de Reconnaissance Visuelle de la Parole (RVP), lecture labiale par machine ou lecture labiale automatique. Ce processus se compose principalement de deux étapes : la première consiste à extraire des caractéristiques visuelles et temporelles à partir d'une séquence de trames vidéo ; la seconde consiste à traiter ces caractéristiques en unités de discours telles que des caractères, des mots ou des phrases. La technologie de lecture labiale profonde peut être appliquée dans de nombreux domaines, améliorant ainsi l'efficacité et l'accessibilité de la communication.