HyperAIHyperAI

Command Palette

Search for a command to run...

Sato : Détection de Type Sémantique Contextuel dans les Tableaux

Dan Zhang Yoshihiko Suhara Jinfeng Li Madelon Hulsebos Çağatay Demiralp Wang-Chiew Tan

Résumé

La détection des types sémantiques des colonnes de données dans les tables relationnelles est cruciale pour diverses tâches de préparation de données et de recherche d'information, telles que le nettoyage de données, l'appariement de schémas, la découverte de données et la recherche sémantique. Cependant, les approches existantes pour la détection soit fonctionnent mal avec des données sales, soit ne prennent en charge qu'un nombre limité de types sémantiques, soit échouent à intégrer le contexte tabulaire des colonnes ou encore dépendent de grandes quantités d'échantillons pour les données d'entraînement. Nous présentons Sato, un modèle hybride d'apprentissage automatique conçu pour détecter automatiquement les types sémantiques des colonnes dans les tables, en exploitant les signaux provenant du contexte ainsi que des valeurs des colonnes. Sato combine un modèle d'apprentissage profond formé sur un corpus tabulaire à grande échelle avec la modélisation de sujets et la prédiction structurée pour atteindre des scores F1 pondérés par le support et une moyenne macro de 0,925 et 0,735 respectivement, surpassant considérablement les performances actuelles de l'état de l'art. Nous analysons en détail les performances globales et par type de Sato, discutant de la manière dont chaque composante du modèle ainsi que chaque catégorie de caractéristiques contribue à ses résultats.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Sato : Détection de Type Sémantique Contextuel dans les Tableaux | Articles | HyperAI