
要約
無教師解析の手法を紹介します。この手法は、ブートストラッピング分類器を使用して、文内の特定の範囲を支配するノードを識別することに依存しています。分類器は2種類あり、1つは範囲内での操作を行うインサイド分類器、もう1つは指定された範囲外での操作を行うアウトサイド分類器です。これらの2つの分類器による自己学習と協調学習を通じて、両者の相互作用が精度向上に寄与し、その結果として効果的な解析が可能であることを示しました。シードブートストラッピング技術により、これらの分類器を訓練するためのデータが準備されます。さらに、当該手法と既知の言語(左枝/右枝)の事前分岐知識および最小限のヒューリスティックを用いた弱い監督の組み合わせがパーザーに強い帰納的バイアスを注入し、英語(PTB)テストセットで63.1 F$_1$スコアを達成したことを分析で確認しました。また、中国語(CTB)と日本語(KTB)のツリバンクでの評価を通じて、当該アーキテクチャの有効性を示し、新しい最先端の結果を得ました。当社のコードと事前学習済みモデルはhttps://github.com/Nickil21/weakly-supervised-parsingで入手可能です。