HyperAIHyperAI
il y a 2 mois

Un Modèle Parallèle-Hiérarchique pour la Compréhension par Machine des Données Éparses

Adam Trischler; Zheng Ye; Xingdi Yuan; Jing He; Phillip Bachman; Kaheer Suleman
Un Modèle Parallèle-Hiérarchique pour la Compréhension par Machine des Données Éparses
Résumé

La compréhension du texte non structuré est un objectif majeur dans le domaine du traitement automatique des langues naturelles. Les tests de compréhension posent des questions basées sur de courts passages de texte pour évaluer cette capacité. Dans ce travail, nous examinons la compréhension par machine sur le benchmark difficile {\it MCTest}. En raison de sa taille limitée, les travaux précédents sur {\it MCTest} se sont principalement concentrés sur l'ingénierie de meilleures caractéristiques. Nous abordons ce jeu de données avec une approche neuronale, en utilisant des réseaux neuronaux simples disposés en hiérarchie parallèle. Cette hiérarchie parallèle permet à notre modèle de comparer le passage, la question et la réponse sous divers angles d'analyse entraînables, contrairement à l'utilisation d'un ensemble rigide de caractéristiques conçu manuellement. Ces angles d'analyse vont du niveau des mots aux fragments de phrases en passant par des séquences de phrases ; les réseaux opèrent uniquement sur des représentations textuelles basées sur les plongements (embeddings) de mots. Lorsqu'ils sont formés avec une méthodologie conçue pour aider à faire face aux données d'entraînement limitées, notre modèle Parallèle-Hiérarchique établit un nouveau standard pour {\it MCTest}, surpassant légèrement les approches précédentes basées sur l'ingénierie des caractéristiques et dépassant considérablement les approches neuronales antérieures (de plus de 15\% absolu).

Un Modèle Parallèle-Hiérarchique pour la Compréhension par Machine des Données Éparses | Articles de recherche récents | HyperAI