Multimodal Abstractive Text Summarization
La multimodalité abstraite en résumé de texte est une sous-tâche dans le domaine du traitement automatique des langues naturelles qui vise à générer un contenu de résumé plus riche et précis en intégrant des informations provenant de plusieurs modalités (telles que le texte, les images, l'audio, etc.). Cette tâche ne se concentre pas seulement sur l'extraction et la réorganisation des informations textuelles, mais met également l'accent sur la fusion et la compréhension des informations inter-modales pour améliorer la exhaustivité et l'expressivité du résumé. Sa valeur d'application réside dans le fait de fournir aux utilisateurs une vue d'ensemble plus intuitive et diversifiée de l'information, adaptée à divers scénarios tels que le journalisme, la recherche académique, les médias sociaux, et bien d'autres.