Natural Language Moment Retrieval
La récupération de moments en langage naturel est une technique d'indexation multimodale qui combine le traitement du langage naturel et la vision par ordinateur pour localiser avec précision des segments spécifiques liés à des requêtes descriptives au sein de vidéos et d'autres données multimédias. Cette technologie vise à améliorer l'accessibilité et l'efficacité d'utilisation des contenus multimédias, et elle est largement appliquée dans les recherches vidéo intelligentes, la modération de contenu et les recommandations personnalisées.