Modèles profonds structurés non supervisés pour le raisonnement de sens commun

Le raisonnement basé sur le sens commun est fondamental pour la compréhension du langage naturel. Alors que les méthodes traditionnelles s'appuient fortement sur des caractéristiques et des bases de connaissances élaborées par l'homme, nous explorons l'apprentissage de connaissances de sens commun à partir d'un grand volume de texte brut via un apprentissage non supervisé. Nous proposons deux modèles de réseaux neuronaux basés sur le cadre des Modèles Sémantiques Structurels Profonds (DSSM) pour aborder deux tâches classiques de raisonnement basé sur le sens commun : les défis du schéma Winograd (WSC) et la désambiguïsation des pronoms (PDP). L'évaluation montre que les modèles proposés capturent efficacement les informations contextuelles dans la phrase ainsi que les informations de corréférence entre pronoms et noms, et réalisent une amélioration significative par rapport aux approches précédentes de pointe.