Intégration conjointe de l'émbedding sémantique et structurel du langage pour la complétion des graphes de connaissances

La tâche de complétion des triplets de connaissances présente de nombreuses applications en aval. À la fois l'information structurale et sémantique jouent un rôle crucial dans la complétion des graphes de connaissances. Contrairement aux approches précédentes qui s'appuient uniquement sur la structure ou sur la sémantique des graphes de connaissances, nous proposons d'intégrer conjointement la sémantique des descriptions en langage naturel des triplets de connaissances avec leurs informations structurelles. Notre méthode réalise l'encodage des graphes de connaissances pour la tâche de complétion en fine-tuning des modèles linguistiques pré-entraînés à l'aide d'une perte structurée probabiliste, où le passage avant du modèle linguistique capture la sémantique tandis que la perte permet de reconstruire la structure. Nos expérimentations étendues sur divers benchmarks de graphes de connaissances ont démontré les performances de pointe de notre méthode. Nous montrons également que notre approche permet d'améliorer significativement les résultats dans un régime à faible ressource, grâce à une utilisation plus efficace de la sémantique. Le code et les jeux de données sont disponibles à l'adresse suivante : https://github.com/pkusjh/LASS.