Modèle d’encodage de phrases multi-tâches pour la récupération sémantique dans les systèmes de réponse aux questions

Les systèmes de réponse aux questions (QA) sont utilisés pour fournir automatiquement des réponses appropriées aux questions posées par les utilisateurs. La correspondance entre phrases constitue une tâche essentielle dans les systèmes QA, souvent reformulée comme un problème d’identification de paraphrases (PI). Étant donné une question, l’objectif de cette tâche est de trouver la question la plus similaire parmi une base de connaissances QA. Dans cet article, nous proposons un modèle d’encodage de phrases multi-tâches (MSEM) pour le problème d’identification de paraphrases, dans lequel un graphe connecté est utilisé pour représenter les relations entre les phrases, et un modèle d’apprentissage multi-tâches est appliqué pour traiter simultanément la tâche de correspondance de phrases et celle de classification de l’intention des phrases. En outre, nous avons mis en œuvre un cadre général de récupération sémantique combinant notre modèle proposé et la technologie de voisinage le plus proche approximatif (ANN), permettant ainsi de retrouver très rapidement la question la plus similaire parmi l’ensemble des candidats disponibles lors d’un traitement en ligne. Les expérimentations montrent l’efficacité supérieure de notre méthode par rapport aux modèles existants de correspondance de phrases.