
要約
我々は、容易に入手可能なラベルなしデータを用いて、二段階構造のパーサ・リランカー系を自己学習させる、簡潔かつ驚くほど効果的な手法を提示する。本研究では、自己学習(ブートストラップ)が、生成された解析結果を判別型リランカーによって処理することで、構文解析において可能であることを示す。改良されたモデルは、ウォール・ストリート・ジャーナル(Wall Street Journal)の構文解析において、従来の最良結果より絶対値で1.1%(誤り率12%の削減)向上し、Fスコア92.1%を達成した。最後に、この現象をより深く理解するための分析を提供する。