HyperAIHyperAI
il y a 18 jours

Résolution d'entités avec des réseaux de neurones à attention hiérarchiques sur graphe

{Xinqiao Lv, Hai Jin, Gao Cong, Yuhong Gu, Dezhong Yao}
Résumé

La résolution d'entités (Entity Resolution, ER) consiste à lier des entités provenant de sources différentes mais faisant référence à la même entité du monde réel. Les travaux existants prennent généralement des paires d'entités en entrée et évaluent indépendamment chaque paire. Toutefois, des dépendances inter-paires sont fréquemment présentes dans les décisions d'ER, par exemple, les entités provenant de la même source de données sont souvent sémantiquement corrélées. De plus, les approches actuelles d'ER se fondent principalement sur la comparaison de similarité entre attributs, tout en ignorant les dépendances entre ces attributs. Pour surmonter les limites des méthodes existantes, nous proposons HierGAT, une nouvelle méthode d'ER basée sur un réseau de transformation à attention sur graphe hiérarchique (Hierarchical Graph Attention Transformer Network), capable de modéliser et d'exploiter les dépendances entre différentes décisions d'ER. Les avantages de notre méthode s'expliquent par deux points principaux : 1) l'utilisation d'un modèle de réseau d'attention sur graphe pour des décisions d'ER conjointes ; 2) la capacité d'attention sur graphe à identifier les mots discriminants au sein des attributs et à repérer les attributs les plus discriminants. En outre, nous proposons d'apprendre des embeddings contextuels afin d'enrichir les embeddings des mots et d'améliorer les performances. Les résultats expérimentaux sur des jeux de données publics de référence montrent que HierGAT dépasse DeepMatcher d'un taux d'exactitude F1 maximal de 32,5 % et atteint un gain maximal de 8,7 % par rapport à Ditto.