17日前

Twitterにおける敵対的ニューラルネットワークを用いた品詞タグ付け

{Haoran Huang, Xuanjing Huang, Tao Gui, Minlong Peng, Qi Zhang}
Twitterにおける敵対的ニューラルネットワークを用いた品詞タグ付け
要約

本研究では、ツイートにおける品詞タグ付け問題に取り組む。ニュース記事とは異なり、ツイートは通常非公式な表現を含み、多くの未知語(out-of-vocabulary語)を含む。さらに、この分野における大規模なラベル付きデータセットが不足している。これらの課題に対処するため、本研究では、外部ドメインのラベル付きデータ、ドメイン内でのラベルなしデータ、およびドメイン内でのラベル付きデータを活用する新たなニューラルネットワークを提案する。敵対的ニューラルネットワークのアイデアを踏襲し、提案手法は敵対的ディスクリミネーターを通じて共通特徴を学習することを目指す。また、ターゲットドメインのドメイン固有特徴は一定程度保持されるべきであるという仮説を設定し、その実現のため、シーケンス・トゥ・シーケンス型オートエンコーダを採用している。3つの異なるデータセットを用いた実験結果から、本手法が最先端の手法よりも優れた性能を達成することが確認された。