HyperAIHyperAI
il y a un mois

Combinaison de caractéristiques de similarité et d'apprentissage profond pour la détection de position dans le contexte de vérification des fausses nouvelles

Luís Borges; Bruno Martins; Pável Calado
Combinaison de caractéristiques de similarité et d'apprentissage profond pour la détection de position dans le contexte de vérification des fausses nouvelles
Résumé

Les fausses informations constituent aujourd'hui une préoccupation urgente, en raison de leur récente montée en puissance comme menace potentielle pour le journalisme de qualité et un débat public bien informé. Le Fake News Challenge (FNC-1) a été organisé en 2017 pour encourager le développement de systèmes de classification basés sur l'apprentissage automatique pour la détection de positionnement (c'est-à-dire pour identifier si un article de presse donné est d'accord, en désaccord, discute ou n'a aucun rapport avec un titre de presse particulier), afin d'aider à la détection et à l'analyse des cas possibles de fausses informations. Cet article présente une nouvelle approche pour aborder ce problème de détection de positionnement, fondée sur la combinaison de caractéristiques de similarité textuelle avec une architecture neuronale profonde qui s'appuie sur des idées avancées précédemment dans le contexte d'apprentissage de représentations textuelles efficaces, de classification de documents et d'inférence en langage naturel. Plus précisément, nous utilisons des Réseaux Neuronaux Récursifs bidirectionnels, associés à un max-pooling sur la dimension temporelle/séquentielle et à l'attention neuronale, pour représenter (i) le titre, (ii) les deux premières phrases de l'article de presse, et (iii) l'article complet. Ces représentations sont ensuite combinées/comparées, complétées par des caractéristiques de similarité inspirées d'autres approches du FNC-1, puis transmises à une couche finale qui prédit le positionnement de l'article par rapport au titre. Nous explorons également l'utilisation de sources externes d'information, notamment des grands ensembles de données composés de paires de phrases initialement proposés pour entraîner et évaluer des méthodes d'inférence en langage naturel, afin d'effectuer un pré-entraînement spécifique des composants architecturaux du réseau neuronal (par exemple, les RNN utilisés pour encoder les phrases). Les résultats obtenus témoignent de l'efficacité des idées proposées et montrent que notre modèle, particulièrement lorsqu'il intègre un pré-entraînement et la combinaison des représentations neuronales avec des caractéristiques de similarité, dépasse légèrement l'état actuel de l'art.

Combinaison de caractéristiques de similarité et d'apprentissage profond pour la détection de position dans le contexte de vérification des fausses nouvelles | Articles de recherche récents | HyperAI