17日前

仮想アシスタントに向けたメッセージの視点を変換する

Isabelle G. Lee, Vera Zu, Sai Srujana Buddi, Dennis Liang, Purva Kulkarni, Jack G.M. Fitzgerald
仮想アシスタントに向けたメッセージの視点を変換する
要約

バーチャルアシスタントは時として非常に直訳的な対応を示すことがある。たとえばユーザーが「ボブに、僕は彼を愛していると言った」と発話した場合、大多数のバーチャルアシスタントは「彼を愛している」というメッセージを抽出し、連絡先に登録された名前が「ボブ」の相手にそのまま送信してしまう。しかし、適切な処理としては「あなたを愛している」という視点の変換が求められる。本研究では、あるユーザーからの音声メッセージを受信し、その視点を変換した上で、宛先ユーザーに送信するシステムを設計した。このシステムは、線形テキスト分類モデル、品詞タグ付け、構文構造解析(constituency parsing)を統合したルールベースモデルを採用した。また、ニューラル機械翻訳(NMT)アプローチとしてLSTM、CopyNet、T5の各手法についても検討した。自然さと忠実性(faithfulness)を自動評価するため、5種類の指標を検証した結果、忠実性評価にはBLEUとMETEORを、自然さ評価には別途訓練された言語モデル(GPT)を用いた相対的 perplexity を採用した。T5とTransformer-CopyNetは忠実性指標で類似の性能を示し、T5がわずかに優れており、BLEUスコア63.8、METEORスコア83.0を達成した。一方、自然さに関してはCopyNetが最も優れており、相対的 perplexity 1.59を記録した。さらに、CopyNetはT5に比べてパラメータ数が37分の1にまで削減されている。本研究で用いたデータセット(46,565件のクラウドソーシングによるサンプルから構成)は、公開済みである。