2ヶ月前
非監督ニューラルテキスト単純化
Sai Surya; Abhijit Mishra; Anirban Laha; Parag Jain; Karthik Sankaranarayanan

要約
本論文では、ラベル付けされていないテキストコーパスのみを用いた非監督型ニューラルテキスト簡素化の最初の試みを提示します。中心的なフレームワークは、共有エンコーダと2つのアテンションデコーダから構成され、単語や文法構造の簡素化に関する知識は、判別損失とノイズ除去を通じて獲得されます。このフレームワークは、en-Wikipediaダンプから収集されたラベル付けされていないテキストを使用して訓練されました。公的テストデータに対する当方の分析(定量的および定性的な評価者を含む)は、提案されたモデルが既存の監督型手法に匹敵する単語レベルと文法構造レベルでのテキスト簡素化を行うことができることを示しています。さらに、数少ないラベル付きペアを追加することで、性能が更に向上することも確認されました。