
要約
現在のテキスト分類手法の多くは、高次元の識別性を持つテキスト表現を抽出することに注力しているが、こうした手法は一般的に計算効率が低いという課題を抱えている。この問題を緩和するため、ラベル埋め込み(label embedding)フレームワークが提案されており、ラベルからテキストへのアテンション機構を用いることで、ラベル情報を直接的に活用してテキスト表現を構築することで、より効率的なテキスト分類を実現している。これらのラベル埋め込み手法は有望な成果を上げているものの、ラベル情報をより効果的に活用する方法についてはまだ多くの余地が残されている。本研究では、テキストからラベルへのアテンションを用いて、テキストに注目されたラベル表現をさらに構築することで、ラベル情報の有効活用を目指す。そのため、テキストとラベルを相互に注目する表現に統合的に符号化する「ラベル埋め込みを備えたコアテンションネットワーク(Coattention Network with Label Embedding: CNLE)」を提案する。このアプローチにより、モデルはテキストとラベルの両方の関連部分に注目することができる。実験の結果、本手法は7つの多クラス分類ベンチマークおよび2つの多ラベル分類ベンチマークにおいて、従来の最先端手法と比較して競争力のある性能を達成した。