HyperAIHyperAI

Command Palette

Search for a command to run...

Appariement et regroupement évolutifs d'entités avec FAMER

Erhard Rahm Eric Peukert Markus Nentwig Alieh Saeedi

Résumé

La résolution d’entités vise à identifier des entités sémantiquement équivalentes, par exemple des produits ou des clients identiques décrits de manière différente. Ce défi est particulièrement important dans les applications Big Data, où de grandes quantités de données provenant de multiples sources doivent être appariées et intégrées. Nous introduisons donc un cadre de résolution d’entités évolutif appelé FAMER (FAst Multi-source Entity Resolution system), basé sur Apache Flink pour une exécution distribuée, capable d’effectuer une correspondance globale d’entités issues de plusieurs sources. À cette fin, FAMER intègre plusieurs schémas de regroupement (clustering) qui rassemblent les entités correspondantes provenant de sources différentes dans des clusters. En plus des schémas de clustering déjà connus, FAMER propose de nouvelles approches spécifiquement conçues pour la résolution d’entités multi-sources. Nous menons une évaluation comparative détaillée de huit schémas de clustering sur des jeux de données réels et synthétiques. Cette évaluation prend en compte à la fois la qualité des correspondances et la scalabilité selon le nombre de machines utilisées et la taille des données.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp