
要約
本論文では、単純でありながら効果的な単語意味曖昧性解消のモデルを提案します。当該手法は、全単語間で共有される双方向長期短期記憶(Bidirectional Long Short-Term Memory, BiLSTM)ネットワークを活用しています。これにより、モデルは統計的強度を共有し、語彙サイズに応じて良好にスケーリングすることが可能となります。モデルはエンドツーエンドで訓練され、生のテキストから意味ラベルへ直接対応付けを行います。また、単語順序を効果的に利用します。我々は2つの標準データセット上で当該手法を評価し、ハイパーパラメータ設定は同一とし、さらにそれらの調整には別の検証データセットを使用しました。外部リソース(例:知識グラフ、品詞タグ付けなど)、言語特有の特徴量、または手作業によるルールなどを使用せずに、それでも最良の最先端システムと同等の統計的結果を達成しています。この翻訳では以下の点に注意しました:- 「word sense disambiguation」を「単語意味曖昧性解消」と訳しました。- 「bidirectional long short-term memory network」を「双方向長期短期記憶ネットワーク (BiLSTM)」と訳し、括弧内に原文も記載しました。- 「end-to-end」を「エンドツーエンド」と訳しました。- 「held out data」を「検証データセット」と訳しました。- 「state-of-the-art systems」を「最先端システム」と訳しました。