11日前
中国語会話音声における省略された代名詞回復と会話的ディスコース解析のための統合モデル
Jingxuan Yang, Kerui Xu, Jun Xu, Si Li, Sheng Gao, Jun Guo, Nianwen Xue, Ji-Rong Wen

要約
本稿では、中国語会話言語における共同された省略代名詞の復元(DPR)と会話的ディスコース解析(CDP)のためのニューラルモデルを提示する。我々は、DPRとCDPが密接に関連しており、共同モデルが両タスクに有益であることを示す。本モデルを「DiscProReco」と呼ぶ。DiscProRecoは、まず会話内の各発話におけるトークンを有向グラフ畳み込みネットワーク(GCN)で符号化する。その後、各発話のトークン状態を統合して、それぞれの発話に対して単一の状態を生成する。この発話状態を、二重アフィン分類器(biaffine classifier)に投入し、会話的ディスコースグラフを構築する。次に、発話状態に対して第二の(多関係型の)GCNを適用し、ディスコース関係を補強した発話表現を生成する。この表現は、各発話内のトークン状態と統合され、省略代名詞復元層への入力として用いられる。本モデルは、我々が両種類の情報を付加的にアノテーションした新しい構造解析強化型省略代名詞復元(SPDPR)データセット上で訓練および評価された。SPDPRデータセットおよび他のベンチマークにおける実験結果から、DiscProRecoが両タスクの最先端手法を著しく上回ることが示された。