
要約
文分類タスクにおいて、隣接する文などの追加的なコンテキストが分類器の精度を向上させる可能性があります。しかし、これらのコンテキストはドメイン依存であり、適切でないドメインの別の分類タスクでは使用できません。対照的に、私たちはドメインにかかわらず常に利用可能な翻訳された文をコンテキストとして使用することを提案します。私たちは、翻訳の単純な特徴拡張は僅かな改善しか得られず、不正確な翻訳によりノイジーな文ベクトルが生成されるため、分類器の性能が低下する可能性があることを発見しました。この問題に対処するために、私たちは複数コンテキスト修正アタッチメント(Multiple Context Fixing Attachment: MCFA)を提示します。これは、他の文ベクトルをコンテキストとして使用してベクトル内のノイズを修正する一連のモジュールです。実験結果から、私たちの手法は以前のモデルと比較して競争力のある性能を示し、複数のデータセットで最良の分類性能を達成しています。私たちは初めて、翻訳をドメインフリーなコンテキストとして文分類に使用しました。