Déinterlacement Vidéo en Temps Réel et Profondeur

L'entrelacement est une technique largement utilisée pour la diffusion télévisuelle et l'enregistrement vidéo, permettant de doubler le taux d'images perçu sans augmenter la bande passante. Cependant, cette technique présente des artefacts visuels gênants, tels que du clignotement et des effets de dentelure sur les contours, lors de la lecture. Les méthodes actuelles d'anti-entrelacement soit ignorent les informations temporelles pour offrir des performances en temps réel mais avec une qualité visuelle inférieure, soit estiment le mouvement pour un meilleur anti-entrelacement mais au prix d'un coût computationnel plus élevé. Dans cet article, nous présentons la première méthode basée sur des réseaux de neurones convolutifs profonds (DCNNs) capable d'effectuer l'anti-entrelacement avec une haute qualité visuelle tout en assurant des performances en temps réel. Contrairement aux modèles existants pour les problèmes de sur-résolution qui reposent sur l'hypothèse d'invariance par translation, notre modèle DCNN proposé utilise les informations temporelles provenant à la fois des demi-images impaires et paires pour reconstruire uniquement les lignes de balayage manquantes, tout en conservant les lignes de balayage impaires et paires données pour produire les images entièrement dé-entrelacées. En introduisant une architecture partageant les couches, notre système peut atteindre des performances en temps réel sur une seule GPU. Les expériences montrent que notre méthode surpassent toutes les méthodes existantes en termes de précision de reconstruction et de performance computationnelle.