要約
質問分類は、自然言語で提示された質問に対して、回答文のエンティティタイプを予測するタスクであり、正確な回答の検出または構築において重要な役割を果たす。その結果、自動質問応答システムの品質向上に寄与する。従来の研究では、質問から自動的に語彙的、構文的、意味的特徴を抽出し、分類に活用していた。しかし、これらの特徴をすべて組み合わせても、すべての種類の質問に対して最良の結果が得られるとは限らない。本研究では、従来のアプローチとは異なり、異なる質問タイプに適応可能な効率的な特徴の抽出と選択の問題に焦点を当てる。まず、異なる質問タイプに応じた適切な特徴を決定するための特徴選択アルゴリズムの利用法を提案する。次に、質問パターンに基づく新たなタイプの特徴を設計する。本研究で提案するアプローチは、ベンチマークデータセットTRECを用いて検証され、分類アルゴリズムとしてサポートベクターマシン(SVM)を採用した。実験の結果、粗粒度および細粒度のデータセットにおいて、それぞれ95.2%および91.6%の精度を達成した。これは従来の研究と比較して顕著に高い性能であり、本手法の有効性を示している。