
要約
マルチパーティ対話型機械読解(MRC)は、1つの対話に複数の発話者が関与するため、複雑な発話者情報の流れやノイズの多い対話文脈を伴い、大きな課題をもたらす。この困難を軽減するために、従来のモデルは、複雑なグラフベースのモジュールを用いてこれらの情報を統合し、手動でラベル付けされた追加データを活用する方法に注力してきたが、実際のシナリオではこのようなデータは通常稀である。本論文では、発話者情報の流れを間接的にモデル化し、長文対話における顕著な手がかりを捉えるために、発話者および重要な発話に関する「労力不要の自己監督型および擬似自己監督型予測タスク」を2つ設計した。2つのベンチマークデータセットにおける実験結果から、本手法が競合モデルおよび現在の最先端モデルを上回る有効性が検証された。