HyperAIHyperAI

Command Palette

Search for a command to run...

FQuAD : Jeu de données de réponse à des questions en français

Martin d&#39 Hoffschmidt Wacim Belblidia Tom Brendlé Quentin Heinrich Maxime Vidal

Résumé

Les avancées récentes dans le domaine de la modélisation du langage ont permis d’améliorer les résultats de pointe sur de nombreuses tâches de traitement du langage naturel. Parmi celles-ci, la compréhension de lecture a connu des progrès significatifs au cours des dernières années. Toutefois, la plupart des résultats sont rapportés en anglais, car les ressources étiquetées disponibles dans d’autres langues, comme le français, restent rares. Dans ce travail, nous introduisons le French Question Answering Dataset (FQuAD), un ensemble de données natif en français pour la compréhension de lecture, comprenant des questions et leurs réponses basées sur un ensemble d’articles Wikipedia. La version 1.0 du dataset contient plus de 25 000 échantillons, tandis que la version 1.1 en regroupe plus de 60 000. Nous entraînons un modèle de référence qui atteint un score F1 de 92,2 et un taux de correspondance exacte de 82,1 sur l’ensemble de test. Afin de suivre l’évolution des modèles de réponse aux questions en français, nous proposons un classement (leaderboard) et avons mis gratuitement à disposition la version 1.0 de notre dataset à l’adresse suivante : https://illuin-tech.github.io/FQuAD-explorer/.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp