Codage sélectif pour la synthèse abstraite de phrases

Nous proposons un modèle d'encodage sélectif pour étendre le cadre séquence-à-séquence à la résumation de phrases abstractive. Ce modèle est composé d'un encodeur de phrases, d'un réseau de portes sélectives et d'un décodeur équipé d'un mécanisme d'attention. L'encodeur et le décodeur sont construits à l'aide de réseaux neuronaux récurrents. Le réseau de portes sélectives construit une représentation de phrase au deuxième niveau en contrôlant le flux d'information de l'encodeur vers le décodeur. Cette représentation au deuxième niveau est spécialement adaptée à la tâche de résumation de phrases, ce qui améliore les performances du modèle. Nous évaluons notre modèle sur les ensembles de données de résumation de phrases abstractive English Gigaword, DUC 2004 et MSR. Les résultats expérimentaux montrent que le modèle d'encodage sélectif proposé surpasse les modèles baselines les plus performants actuellement disponibles (state-of-the-art).