il y a 8 mois

Résumé

La détection des types sémantiques des colonnes de données dans les tables relationnelles est cruciale pour diverses tâches de préparation de données et de recherche d'information, telles que le nettoyage de données, l'appariement de schémas, la découverte de données et la recherche sémantique. Cependant, les approches existantes pour la détection soit fonctionnent mal avec des données sales, soit ne prennent en charge qu'un nombre limité de types sémantiques, soit échouent à intégrer le contexte tabulaire des colonnes ou encore dépendent de grandes quantités d'échantillons pour les données d'entraînement. Nous présentons Sato, un modèle hybride d'apprentissage automatique conçu pour détecter automatiquement les types sémantiques des colonnes dans les tables, en exploitant les signaux provenant du contexte ainsi que des valeurs des colonnes. Sato combine un modèle d'apprentissage profond formé sur un corpus tabulaire à grande échelle avec la modélisation de sujets et la prédiction structurée pour atteindre des scores F1 pondérés par le support et une moyenne macro de 0,925 et 0,735 respectivement, surpassant considérablement les performances actuelles de l'état de l'art. Nous analysons en détail les performances globales et par type de Sato, discutant de la manière dont chaque composante du modèle ainsi que chaque catégorie de caractéristiques contribue à ses résultats.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Apprentissage Profond

Apprentissage Multi-tâches

Compréhension De Document

Domaine De Recherche

Approche/Framework

Traitement Du Langage Naturel

Tâche

Dan Zhang Yoshihiko Suhara Jinfeng Li Madelon Hulsebos Çağatay Demiralp Wang-Chiew Tan

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Apprentissage Profond

Apprentissage Multi-tâches

Compréhension De Document

Domaine De Recherche

Approche/Framework

Traitement Du Langage Naturel

Tâche

Dan Zhang Yoshihiko Suhara Jinfeng Li Madelon Hulsebos Çağatay Demiralp Wang-Chiew Tan

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Sato : Détection de Type Sémantique Contextuel dans les Tableaux | Articles | HyperAI

Command Palette

Sato : Détection de Type Sémantique Contextuel dans les Tableaux

Dan Zhang Yoshihiko Suhara Jinfeng Li Madelon Hulsebos Çağatay Demiralp Wang-Chiew Tan

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Sato : Détection de Type Sémantique Contextuel dans les Tableaux

Dan Zhang Yoshihiko Suhara Jinfeng Li Madelon Hulsebos Çağatay Demiralp Wang-Chiew Tan

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Sato : Détection de Type Sémantique Contextuel dans les Tableaux

Dan Zhang Yoshihiko Suhara Jinfeng Li Madelon Hulsebos Çağatay Demiralp Wang-Chiew Tan

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters