
要約
意味解析(Semantic parsing)は、自然言語(NL)の発話を機械実行可能な意味表現(MR)に変換するタスクを指す。ニューラルネットワークベースの意味解析器は、従来の手法に比べて著しい進展を遂げているが、依然として完全ではない。粗い手動検査でも、生成されたMRの適切性や一貫性の欠如といった顕著な問題が容易に指摘できる。本論文では、ベースラインモデルの観察された問題を修正することを目的とした特徴量を用いて、予測されたMRのn-bestリストを再ランク付けすることで、既存のニューラル意味解析器の性能を迅速に改善する簡単なアプローチを提示する。本研究では、競争力のあるニューラル意味解析器にこの再ランカーを実装し、4つのタスク(意味解析:GEO、ATIS;Pythonコード生成:Django、CoNaLa)において評価を行った。その結果、CoNaLaではBLEUスコアで最大5.7%の絶対値向上、Djangoでは精度で最大2.9%の向上を達成し、すべての4つのデータセットにおいて、これまでに発表された最良のニューラル解析器の結果を上回った。