Ensemble De Données De Réponses Aux Questions Orales Du Domaine Ouvert ODSQA
Date
Taille
URL de publication
ODSQA (ensemble de données de questions-réponses orales à domaine ouvert) Depuis ODSQA : ensemble de données de questions-réponses orales à domaine ouvert . Il s’agit d’un ensemble de données chinois. De plus, un ensemble de données en anglais Spoken-SQuAD est également fourni.icivenez.
Parlé-SQuAD Il s'agit d'un corpus de questions-réponses orales généré à partir de l'ensemble de données SQuAD via le système de synthèse vocale (TTS) de Google. Bien que Spoken-SQuAD soit suffisamment grand pour former des modèles de questions-réponses intelligents de pointe, il est généré artificiellement et présente donc toujours un certain écart avec les véritables questions-réponses orales. Les chercheurs ont donc publié un ensemble de données SQA contenant plus de trois mille questions, appelé ODSQA. Il s’agit actuellement du plus grand ensemble de données SQA du monde réel pour les tâches de réponse aux questions intelligentes basées sur l’extraction.