
要約
深層的インサイドアウトサイド再帰型オートエンコーダー(DIORA)を提案する。本手法は、構文の自動発見を完全に教師なしで行うものであり、生成された木構造内の句の表現を同時に学習する。本アプローチでは、入力文の各単語をその他の単語を条件として予測する。学習段階では、文のすべての可能な二分木を考慮するために動的計画法を用い、推論段階ではCKYアルゴリズムを用いてスコアが最大の解析木を抽出する。DIORAは、標準ベンチマークデータセットWSJにおける未教師付き二分構文解析の既存の結果を上回る性能を達成した。