Grand système de réponse aux questions simples avec des réseaux à mémoire

L'entraînement de systèmes de réponse à grande échelle est complexe car les sources d'entraînement couvrent généralement une petite partie du spectre des questions possibles. Cet article étudie l'impact de l'apprentissage multitâche et de l'apprentissage par transfert pour la réponse à des questions simples ; un contexte dans lequel la raisonner requise pour répondre est assez facile, à condition de pouvoir récupérer les preuves correctes en fonction d'une question, ce qui peut être difficile dans des conditions à grande échelle. À cette fin, nous présentons un nouveau jeu de données composé de 100 000 questions que nous utilisons en conjonction avec des benchmarks existants. Nous menons notre étude dans le cadre des Réseaux Mémoire (Memory Networks) (Weston et al., 2015), car cette approche nous permet d'éventuellement passer à des raisonnements plus complexes, et montrons que les Réseaux Mémoire peuvent être entraînés avec succès pour obtenir d'excellentes performances.