2ヶ月前

Greedy Dependency Parsersのアンサンブルを1つのMSTパーサに蒸留する

Adhiguna Kuncoro; Miguel Ballesteros; Lingpeng Kong; Chris Dyer; Noah A. Smith
Greedy Dependency Parsersのアンサンブルを1つのMSTパーサに蒸留する
要約

新規の最先端を達成した2つの1次グラフベースの依存関係解析器について紹介します。第1の解析器は、異なるランダム初期化を持つ独立して訓練された貪欲なLSTM遷移ベースの解析器のアンサンブルから構築されたコンセンサス解析器です。このアプローチをハミングコストに基づく最小ベイズリスクデコーディングとして位置づけ、アンサンブル内の弱いコンセンサスが難易度や曖昧性の有用な指標であると主張します。第2の解析器は、アンサンブルを単一モデルに「蒸留」したものです。我々は、各可能な接続に対するアンサンブルの不確実性推定を組み込んだ新しいコストを使用し、構造化出力問題に対して標準的な蒸留目的関数を適用する際に必要となる計算不能なクロスエントロピー計算を避けるために、構造化ヒンジ損失目的関数で蒸留解析器を訓練しました。1次の蒸留解析器は、英語、中国語、ドイツ語において既存の最先端と同等かそれ以上の性能を示しています。

Greedy Dependency Parsersのアンサンブルを1つのMSTパーサに蒸留する | 最新論文 | HyperAI超神経