HyperAIHyperAI

Command Palette

Search for a command to run...

GraPPa : Pré-entraînement augmenté par la grammaire pour l'analyse sémantique de table

Tao Yu Chien-Sheng Wu Xi Victoria Lin Bailin Wang Yi Chern Tan Xinyi Yang Dragomir Radev Richard Socher Caiming Xiong

Résumé

Nous présentons GraPPa, une approche efficace de pré-entraînement pour la parse des tables sémantiques, qui apprend une biais inductif compositionnel dans les représentations conjointes des données textuelles et tabulaires. Nous construisons des paires question-SQL synthétiques à partir de tables de haute qualité à l’aide d’une grammaire libre de contexte synchrone (SCFG) induite à partir de jeux de données existants de type texte vers SQL. Nous pré-entraînons notre modèle sur ces données synthétiques en utilisant une nouvelle tâche de liaison texte-schéma, qui prédit le rôle syntaxique d’un champ de table dans la requête SQL pour chaque paire question-SQL. Afin de préserver la capacité du modèle à représenter des données du monde réel, nous intégrons également un modèle de masking language modeling (MLM) sur plusieurs jeux de données existants de tables et de langage, afin de régulariser le processus de pré-entraînement. Sur quatre benchmarks populaires de parse sémantique de tables, à la fois entièrement supervisés et faiblement supervisés, GraPPa surpasse significativement RoBERTa-large lorsqu’il est utilisé comme couche de représentation des caractéristiques, et établit de nouveaux records d’état de l’art sur l’ensemble d’entre eux.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp