Profiling de la structure du discours d'actualité à l'aide de structures de sous-sujets explicites guidées par des critiques

Nous présentons un cadre d'actor-critic visant à induire des structures sous-thématiques au sein d'un article de presse pour le profilage du discours journalistique. Le modèle utilise plusieurs critiques agissant selon des structures sous-thématiques connues, tandis que l'acteur cherche à les surpasser. Les structures de contenu sont constituées de phrases représentant des frontières latentes entre sous-thèmes. Ensuite, nous introduisons un réseau neuronal hiérarchique qui utilise les phrases identifiées comme frontières sous-thématiques pour modéliser les interactions à plusieurs niveaux entre les phrases, les sous-thèmes et le document entier. Les résultats expérimentaux et les analyses effectués sur le corpus NewsDiscourse montrent que le modèle d'acteur parvient à segmenter efficacement un document en sous-thèmes, et améliore ainsi les performances du modèle hiérarchique sur la tâche de profilage du discours journalistique.