HyperAIHyperAI
il y a 11 jours

Accélération de l’alignement d’entités 10* : Réseau de correspondance à attention dual avec extraction normalisée d’échantillons difficiles

Xin Mao, Wenting Wang, Yuanbin Wu, Man Lan
Accélération de l’alignement d’entités 10* : Réseau de correspondance à attention dual avec extraction normalisée d’échantillons difficiles
Résumé

La recherche d'entités équivalentes parmi plusieurs graphes de connaissances (KG) constitue l'étape fondamentale de l'intégration des KG, également connue sous le nom d’alignement d’entités (EA). Toutefois, la plupart des méthodes actuelles d’EA sont inefficaces et peu évolutives. Une synthèse récente souligne que certaines d’entre elles nécessitent même plusieurs jours pour traiter un jeu de données comptant 200 000 nœuds (DWY100K). Nous estimons que la surcomplexité du encodeur de graphe et la stratégie inefficace d’échantillonnage négatif sont les deux principales causes de ce problème. Dans cet article, nous proposons un nouvel encodeur de KG, nommé Réseau d’Appariement par Attentions Doubles (Dual-AMN), qui modélise de manière intelligente à la fois les informations intra-graphe et inter-graphe, tout en réduisant considérablement la complexité computationnelle. Par ailleurs, nous introduisons une fonction de perte basée sur le mining d’échantillons négatifs durs normalisés, permettant une sélection fluide des échantillons négatifs difficiles tout en atténuant le décalage de perte. Les résultats expérimentaux sur des jeux de données publics largement utilisés montrent que notre méthode atteint à la fois une haute précision et une grande efficacité. Sur le jeu de données DWY100K, l’exécution complète de notre méthode s’achève en seulement 1 100 secondes, soit au moins 10 fois plus rapide que les approches antérieures. Les performances de notre méthode surpassent également celles des méthodes existantes sur l’ensemble des jeux de données, avec une amélioration des métriques Hits@1 et MRR passant de 6 % à 13 %.

Accélération de l’alignement d’entités 10* : Réseau de correspondance à attention dual avec extraction normalisée d’échantillons difficiles | Articles de recherche récents | HyperAI