Défense contre les fausses nouvelles neuronales

Les récents progrès dans la génération de langage naturel ont soulevé des préoccupations relatives à un usage à double tranchant. Bien que les applications telles que le résumé et la traduction soient positives, la technologie sous-jacente pourrait également permettre aux adversaires de générer de fausses nouvelles neuronales : une propagande ciblée qui imite étroitement le style des vraies nouvelles.La sécurité informatique moderne repose sur une modélisation minutieuse des menaces : l'identification des menaces et vulnérabilités potentielles du point de vue de l'adversaire, ainsi qu'une exploration des atténuations possibles face à ces menaces. De même, le développement de défenses robustes contre les fausses nouvelles neuronales nécessite d'abord une investigation et une caractérisation soigneuses des risques associés à ces modèles. Nous présentons donc un modèle pour la génération de texte contrôlable appelé Grover. Étant donné un titre comme « Lien établi entre vaccins et autisme », Grover peut générer le reste de l'article ; les humains trouvent ces générations plus crédibles que les désinformations écrites par des humains.Le développement de techniques de vérification robustes contre des générateurs comme Grover est crucial. Nous constatons que les meilleurs discriminants actuels peuvent classer les fausses nouvelles neuronales par rapport aux véritables nouvelles écrites par des humains avec une précision de 73 %, à condition d'avoir accès à un niveau modéré de données d'entraînement. Contre toute attente, la meilleure défense contre Grover s'avère être Grover lui-même, avec une précision de 92 %, soulignant l'importance de la publication publique de générateurs puissants. Nous examinons ces résultats plus en détail, montrant que le biais d'exposition -- et les stratégies d'échantillonnage qui en atténuent les effets -- laissent tous deux des artefacts que des discriminants similaires peuvent détecter. Nous concluons en discutant des questions éthiques liées à cette technologie et prévoyons de publier Grover au grand public, contribuant ainsi à améliorer la détection des fausses nouvelles neuronales.