Apprentissage profond pour la sélection de phrases réponses

La sélection de phrases répondant à une question consiste à identifier les phrases qui contiennent la réponse à une question donnée. Il s'agit d'un problème important en soi, ainsi que dans le cadre plus large de l'interrogation de domaine ouvert. Nous proposons une nouvelle approche pour résoudre cette tâche par le biais de représentations distribuées, et nous apprenons à faire correspondre les questions avec leurs réponses en considérant leur encodage sémantique. Cela contraste avec les travaux antérieurs sur cette tâche, qui reposent généralement sur des classifieurs utilisant un grand nombre de caractéristiques syntaxiques et sémantiques conçues manuellement, ainsi que diverses ressources externes. Notre approche ne nécessite aucune ingénierie de caractéristiques ni l'utilisation de données linguistiques spécialisées, ce qui rend ce modèle facilement applicable à un large éventail de domaines et de langues. Les résultats expérimentaux sur un jeu de données standard du TREC montrent que—malgré sa simplicité—notre modèle atteint des performances équivalentes aux meilleures actuelles pour la tâche de sélection de phrases répondant à une question.