
要約
神経망手法は、意味解析において最近いくつかの成功を収めていますが、形式意味論に基づく意味表現の生成という課題にはまだ対処していません。本稿では、英語文に対してディスコース表現構造(Discourse Representation Structures: DRSs)を高精度で生成できるシーケンス・ツー・シーケンス型の神経意味解析器を提案します。この解析器は従来のDRS解析器を上回る性能を示しています。出力学習を容易にするために、DRSsを平坦な節の系列として表現し、生成されたDRSsが適切で解釈可能であることを確認する方法を導入しました。文字と単語を使用したモデルの比較を行い、文字ベースの方が単語ベースよりも優れた性能を発揮すること(やや意外に)を確認しました。出力から変数名を削除し、デ・ブルーニュ指数(De Bruijn-indices)を使用することでパーサーの性能が向上することも示しました。さらに、銀色教師データ(silver training data)を追加することで、性能はさらに向上します。