il y a 7 mois

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman

Résumé

Nous présentons Spider, un ensemble de données à grande échelle, complexe et interdomaines pour l'analyse sémantique et la conversion texte-à-SQL, annoté par 11 étudiants universitaires. Il comprend 10 181 questions et 5 693 requêtes SQL complexes uniques sur 200 bases de données à multiples tables, couvrant 138 domaines différents. Nous définissons une nouvelle tâche d'analyse sémantique complexe et interdomaines où des requêtes SQL complexes différentes et des bases de données apparaissent dans les ensembles d'entraînement et de test. De cette façon, la tâche nécessite que le modèle généralise bien aux nouvelles requêtes SQL et aux nouveaux schémas de base de données. Spider se distingue de la plupart des tâches d'analyse sémantique précédentes car celles-ci utilisent toutes une seule base de données et les mêmes programmes exacts dans les ensembles d'entraînement et de test. Nous avons expérimenté divers modèles d'avant-garde, et le meilleur modèle n'a atteint qu'une précision exacte de correspondance de 12,4 % dans un scénario de partition de base de données. Cela montre que Spider représente un défi majeur pour les futures recherches. Notre ensemble de données et notre tâche sont disponibles au public à l'adresse suivante : https://yale-lily.github.io/spider

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Jeu De Données

Traitement Du Langage Naturel

Benchmarks

Infrastructure D'ia

Traitement Du Langage Naturel

Tâche

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Jeu De Données

Traitement Du Langage Naturel

Benchmarks

Infrastructure D'ia

Traitement Du Langage Naturel

Tâche

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Spider : Un grand ensemble de données étiquetées par des humains pour l'analyse sémantique complexe et la tâche de transformation du texte en SQL dans plusieurs domaines | Articles | HyperAI

Command Palette

Spider : Un grand ensemble de données étiquetées par des humains pour l'analyse sémantique complexe et la tâche de transformation du texte en SQL dans plusieurs domaines

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman2 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Spider : Un grand ensemble de données étiquetées par des humains pour l'analyse sémantique complexe et la tâche de transformation du texte en SQL dans plusieurs domaines

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman2 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Spider : Un grand ensemble de données étiquetées par des humains pour l'analyse sémantique complexe et la tâche de transformation du texte en SQL dans plusieurs domaines

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman2 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman

Tao Yu Rui Zhang Kai Yang Michihiro Yasunaga Dongxu Wang Zifan Li James Ma Irene Li Qingning Yao Shanelle Roman