
要約
既存の階層的テキスト分類(HTC)手法は、モデルの学習のためにラベルの階層構造を捉えようとするが、推論時には各ラベルについて局所的な決定を行うか、または完全に階層情報を無視する傾向がある。この訓練と推論の間の不整合を解消し、ラベル依存関係をより体系的にモデル化するために、HTCをマルコフ決定過程として定式化し、深層強化学習を通じてラベル割り当て方策(Label Assignment Policy)を学習することを提案する。この方策により、オブジェクトをどこに配置するか、また割り当てプロセスをいつ停止するかを決定する。提案手法であるHiLAPは、訓練時と推論時に一貫して階層構造を探求し、相互依存的な決定を行う。一般的なフレームワークとして、HiLAPは異なるニューラルエンコーダーをベースモデルとして組み込むことができ、エンドツーエンドでの学習が可能である。5つの公開データセットと4つのベースモデルを使用した実験では、HiLAPがフラット分類器に対して平均で33.4%のマクロF1値向上を示し、最先端のHTC手法よりも大幅に優れた性能を発揮した。データとコードはhttps://github.com/morningmoni/HiLAPで入手可能である。