Adaptation des prédicteurs de liens neuronaux pour une réponse aux requêtes complexes avec efficacité de données

Répondre à des requêtes complexes sur des graphes de connaissances incomplets est une tâche ardue où un modèle doit répondre à des requêtes logiques complexes en présence de connaissances manquantes. Les travaux antérieurs dans la littérature ont proposé d'aborder ce problème en concevant des architectures formées de manière end-to-end pour la tâche de réponse aux requêtes complexes, avec un processus de raisonnement difficile à interpréter et nécessitant des formations intensives en données et en ressources. D'autres lignes de recherche ont proposé de réutiliser des prédicteurs simples de liens neuronaux pour répondre à des requêtes complexes, réduisant le volume de données d'entraînement par plusieurs ordres de grandeur tout en fournissant des réponses interprétables. Le prédicteur neuronal de liens utilisé dans ces approches n'est pas explicitement optimisé pour la tâche de réponse aux requêtes complexes, ce qui signifie que ses scores ne sont pas calibrés pour interagir ensemble. Nous proposons d'aborder ces problèmes grâce à CQD$^{\mathcal{A}}$, un modèle d'\emph{adaptation} des scores efficace en termes de paramètres, optimisé pour recalibrer les scores des prédicteurs neuronaux de liens pour la tâche de réponse aux requêtes complexes. Bien que le prédicteur neuronal de liens soit figé, la composante d'adaptation — qui n'augmente le nombre de paramètres du modèle que de $0,03\%$ — est formée sur la tâche complexe downstream (en aval) de réponse aux requêtes. De plus, la composante de calibration nous permet d'effectuer du raisonnement sur des requêtes incluant des négations atomiques, ce qui était auparavant impossible avec les prédicteurs de liens. Dans nos expériences, CQD$^{\mathcal{A}}$ produit des résultats significativement plus précis que les méthodes actuelles les plus performantes, améliorant les valeurs moyennes du rang inverse (Mean Reciprocal Rank) passant de $34,4$ à $35,1$ sur l'ensemble des jeux de données et types de requêtes tout en utilisant $\leq 30\%$ des types de requêtes d'entraînement disponibles. Nous montrons également que CQD$^{\mathcal{A}}$ est efficace en termes de données, atteignant des résultats compétitifs avec seulement $1\%$ des requêtes complexes d'entraînement, et robuste lors d'évaluations hors domaine.