HyperAIHyperAI
il y a 11 jours

Connaître le No-match : Alignement d'entités avec des cas pendantes

Zequn Sun, Muhao Chen, Wei Hu
Connaître le No-match : Alignement d'entités avec des cas pendantes
Résumé

Cet article étudie un nouveau cadre de problème pour l’alignement d’entités dans les graphes de connaissances (KG). Étant donné que les KG possèdent des ensembles d’entités distincts, certaines entités ne peuvent pas trouver d’alignement entre eux, ce qui donne lieu au problème des entités pendantes (dangling entities). En tant que première tentative pour aborder ce problème, nous construisons un nouveau jeu de données et proposons un cadre d’apprentissage multi-tâches pour l’alignement d’entités et la détection des entités pendantes. Ce cadre peut choisir de s’abstenir de prédire un alignement pour les entités pendantes détectées. Nous proposons trois techniques de détection des entités pendantes fondées sur la distribution des distances aux plus proches voisins : la classification par plus proches voisins, le classement marginal et le classement arrière-plan. Après avoir détecté et éliminé les entités pendantes, un modèle intégré d’alignement d’entités dans notre cadre peut fournir un alignement plus robuste pour les entités restantes. Des expériences et analyses approfondies démontrent l’efficacité de notre cadre. Nous constatons également que le module de détection des entités pendantes peut, en retour, améliorer l’apprentissage de l’alignement et les performances finales. Les ressources contribuées sont rendues publiques afin de favoriser de futures recherches.

Connaître le No-match : Alignement d'entités avec des cas pendantes | Articles de recherche récents | HyperAI