Extension de Document par Prédiction de Requête

Une technique pour améliorer l'efficacité de la recherche d'un moteur de recherche consiste à enrichir les documents avec des termes liés ou représentatifs du contenu des documents. Du point de vue d'un système de réponse aux questions, cela pourrait inclure des questions que le document est susceptible de répondre. À la lumière de cette observation, nous proposons une méthode simple qui prédit les requêtes qui seront émises pour un document donné et l'enrichit ensuite avec ces prédictions à l'aide d'un modèle séquence-à-séquence basique, formé à partir de jeux de données composés de paires de requêtes et de documents pertinents. En combinant notre méthode avec un composant de re-rangage très efficace, nous atteignons l'état de l'art dans deux tâches de recherche. Dans un régime critique en latence, les résultats de recherche seuls (sans re-rangage) approchent l'efficacité des re-rangages neuronaux plus coûteux en termes de calcul mais sont beaucoup plus rapides.