
要約
AMR-to-text生成は、抽象意味表現(Abstract Meaning Representation: AMR)グラフから文章を生成することを目指す問題で、最近NLPコミュニティに導入されました。この目的のために、シーケンス・ツー・シーケンスモデルを使用してAMRグラフを文字列に変換することができます。一方、グラフそのものと直接作業を行うアプローチでは、AMRグラフをベクトル表現にエンコードするグラフ・ツー・シーケンスモデルの使用が必要となります。過去の研究では、このようなエンコーディングが有益であることが示されており、シーケンシャルエンコーディングとは異なり、AMRグラフ内の再帰構造(reentrant structures)を明示的に捉えることができます。本研究では、再帰構造(複数の親を持つノード)がAMR-to-text生成に与える影響の程度を調査するために、グラフエンコーダと木構造エンコーダ(再帰構造が保存されない)を比較しました。結果として、再帰構造と長距離依存関係の処理の改善が、全体的なスコア向上に寄与していることが示されました。最良のモデルはLDC2015E86で24.40 BLEUスコアを達成し、現行の最先端技術に対して1.1ポイント上回りました。また、LDC2017T10では24.54 BLEUスコアを達成し、現行の最先端技術に対して1.24ポイント上回る性能を発揮しました。