16日前

質問は実際に何を尋ねているのか? MFAE:マルチファージョン尋問強調を用いた重複質問同定

{Tong Mo, Weiping Li, Bo Wu, Qifei Zhou, Rong Zhang}
要約

重複質問識別(Duplicate Question Identification: DQI)は、大規模なコミュニティ型質問応答システムおよび自動質問応答システムにおける処理効率と精度を向上させる重要なタスクである。DQIの目的は、ペアで提示された質問が意味的に同等であるかどうかを識別することにある。しかし、ペア内の質問における同義語や同音異義語の区別は依然として課題である。従来の研究の多くは、単語レベルまたはフレーズレベルの意味的差異に焦点を当てていた。本研究では、質問の「尋ねる意図(asking emphasis)」をDQIにおける鍵となる要因として初めて提案する。尋ねる意図は、二つの質問間の意味的同等性を橋渡しする役割を果たす。本論文では、多様な融合による尋ねる意図(Multi-fusion Asking Emphasis: MFAE)を組み込んだアテンションモデルを提案する。まず、BERTを用いて動的かつ事前学習された単語埋め込みを取得する。次に、相互アテンション(inter-attention)と自己アテンション(self-attention)の和をそれぞれ用いて、質問内の外部的(inter-asking emphasis)および内部的(intra-asking emphasis)な尋ねる意図を算出する。このアプローチの基本的な考え方は、ある単語が他の単語とより多くの相互作用を持つほど、その単語はより重要であるということである。最後に、8通りの組み合わせを用いて多様な融合による尋ねる意図および多様な融合単語表現を生成する。実験結果から、本モデルはQuora Question PairsおよびCQADupStackデータセットにおいて、既存の最先端手法を上回る性能を達成したことが示された。さらに、SNLIおよびMultiNLIデータセットにおける自然言語推論(Natural Language Inference: NLI)タスクにおいても、モデルの性能向上が確認された。本モデルの実装コードは、https://github.com/rzhangpku/MFAE にて公開されている。