HyperAIHyperAI
il y a 11 jours

Amélioration de la classification des questions par extraction et sélection de caractéristiques

{Le Anh-Cuong, Nguyen Van-Tu}
Résumé

La classification des questions consiste à prédire le type d'entité de la phrase réponse correspondant à une question donnée en langage naturel. Elle joue un rôle essentiel dans la recherche ou la construction de réponses précises, contribuant ainsi à améliorer la qualité des systèmes automatisés de réponse aux questions. Dans les études antérieures, diverses caractéristiques lexicales, syntaxiques et sémantiques étaient extraites automatiquement à partir d'une question afin de soutenir la classification. Toutefois, la combinaison de toutes ces caractéristiques ne conduit pas toujours aux meilleurs résultats pour tous les types de questions. À la différence des travaux antérieurs, ce papier se concentre sur la problématique de l'extraction et de la sélection de caractéristiques efficaces adaptées à chaque type de question. Nous proposons tout d'abord une méthode utilisant un algorithme de sélection de caractéristiques pour identifier les caractéristiques appropriées en fonction des différents types de questions. Ensuite, nous concevons un nouveau type de caractéristiques basé sur les motifs des questions. Nous avons testé notre approche sur le jeu de données de référence TREC, en utilisant la méthode des machines à vecteurs de support (SVM) comme algorithme de classification. Les résultats expérimentaux montrent des taux de précision de 95,2 % et 91,6 % pour les jeux de données à granularité grossière et fine respectivement, ce qui représente une amélioration significative par rapport aux travaux antérieurs.

Amélioration de la classification des questions par extraction et sélection de caractéristiques | Articles de recherche récents | HyperAI