Combinaison de Réseaux de Neurones Convolutionnels et de Réseaux de Neurones Profonds pour la Détection de Fausses Nouvelles

De nos jours, les individus préfèrent suivre les actualités les plus récentes via les réseaux sociaux, car celles-ci sont peu coûteuses, facilement accessibles et diffusées rapidement. Toutefois, elles peuvent également propager des informations fausses, peu fiables ou de faible qualité, contenant intentionnellement des données erronées. La diffusion de fausses nouvelles peut avoir des effets néfastes sur les individus et la société. Étant donné la gravité de ce problème, les chercheurs ont fait leurs meilleurs efforts pour identifier les modèles et caractéristiques propres aux fausses nouvelles, afin de concevoir un système capable de détecter ces dernières avant leur publication. Dans cet article, nous présentons le jeu de données Fake News Challenge étape #1 (FNC-1) et faisons un état des lieux des tentatives concurrentielles visant à construire un système de détection des fausses nouvelles à l’aide de ce jeu de données. Le modèle proposé a été évalué sur le jeu de données FNC-1. Ce dernier est considéré comme un problème ouvert et un défi mondial. La procédure de ce système implique le traitement du texte contenu dans les colonnes « titre » et « corps » à l’aide de différentes techniques de traitement du langage naturel. Ensuite, les caractéristiques extraites sont réduites à l’aide de la méthode du coude tronqué, et la similarité entre chaque paire de documents est calculée à l’aide de la méthode de similarité cosinus souple. Les nouvelles caractéristiques ainsi obtenues sont ensuite introduites dans des approches d’apprentissage profond, à savoir un réseau de neurones convolutif (CNN) et un réseau de neurones profond (DNN). Le système proposé parvient à détecter toutes les catégories avec une haute précision, à l’exception de la catégorie « désaccord ». En conséquence, le système atteint une précision maximale de 84,6 %, se classant ainsi au deuxième rang parmi les études concurrentielles portant sur ce jeu de données.