HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage actif amélioré par graphe pour la résolution d'entités multi-sources

Christian Bizer Anna Primpeli

Résumé

Les méthodes supervisées de résolution d'entités reposent sur des paires d'enregistrements étiquetés afin d'apprendre les schémas de correspondance entre deux ou plusieurs sources de données. L'apprentissage actif permet de réduire l'effort d'étiquetage en sélectionnant uniquement les paires les plus informatives pour l'étiquetage. Les méthodes d'apprentissage actif existantes pour la résolution d'entités ciblent toutes des scénarios de correspondance à deux sources, tout en ignorant les signaux propres aux environnements multi-sources, tels que ceux présents dans le Web des données. Dans cet article, nous proposons ALMSER, une méthode d'apprentissage actif renforcée par graphe pour la résolution d'entités multi-sources. À notre connaissance, ALMSER est la première méthode de résolution d'entités fondée sur l'apprentissage actif spécifiquement conçue pour les scénarios multi-sources. ALMSER exploite le riche graphe de correspondance présent dans les environnements multi-sources afin de sélectionner des paires d'enregistrements informatives. En outre, ce graphe de correspondance est utilisé pour générer des données d'entraînement complémentaires. Nous évaluons notre méthode sur cinq tâches de correspondance multi-sources présentant différentes caractéristiques de profilage. Les résultats expérimentaux montrent qu'exploiter les signaux issus du graphe conduit à de meilleurs résultats, mesurés par le score F1, par rapport aux méthodes d'apprentissage actif utilisant des stratégies de requête basées sur la marge ou sur le comité, sur l'ensemble des tâches étudiées.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Apprentissage actif amélioré par graphe pour la résolution d'entités multi-sources | Articles | HyperAI