HyperAIHyperAI
il y a 2 mois

Identification de Questions Bien Formées en Langue Naturelle

Manaal Faruqui; Dipanjan Das
Identification de Questions Bien Formées en Langue Naturelle
Résumé

Comprendre les requêtes de recherche est un problème complexe, car il implique de traiter du texte en « salade de mots » (word salad) fréquemment émis par les utilisateurs. Cependant, si une requête ressemble à une question bien formulée, un pipeline de traitement du langage naturel peut effectuer une interprétation plus précise, réduisant ainsi les erreurs cumulées en aval. Par conséquent, identifier si une requête est bien formulée peut améliorer la compréhension des requêtes. Dans cet article, nous introduisons une nouvelle tâche consistant à identifier une question bien formulée en langage naturel. Nous avons construit et rendu publique une base de données de 25 100 questions classées en catégories bien formulées et non bien formulées, et nous rapportons une précision de 70,7 % sur l'ensemble de test. Nous montrons également que notre classifieur peut être utilisé pour améliorer les performances des modèles séquence-à-séquence neuronaux destinés à générer des questions pour la compréhension de lecture.

Identification de Questions Bien Formées en Langue Naturelle | Articles de recherche récents | HyperAI