2ヶ月前
少ショットテキスト分類のための誘導ネットワーク
Ruiying Geng; Binhua Li; Yongbin Li; Xiaodan Zhu; Ping Jian; Jian Sun

要約
テキスト分類は、データが不足している場合や未見のクラスに適応する必要がある場合に困難を伴います。このような課題的なシナリオでは、最近の研究でメタ学習が用いられ、新しいクエリがサンプルレベルで小さなサポートセットと比較される少ショットタスクをシミュレートしています。しかし、このサンプルレベルでの比較は、同じクラス内の様々な表現によって著しく乱される可能性があります。したがって、各クラスの一般的な表現をサポートセットから学習し、それを新しいクエリと比較することが望ましいです。本論文では、メタ学習において動的ルーティングアルゴリズムを革新的に活用することで、このような一般的なクラスレベルの表現を学習する新たな誘導ネットワーク(Induction Network)を提案します。これにより、モデルがより良く誘導され一般化することが確認されました。提案されたモデルは、よく研究されている感情分類データセット(英語)と実世界の対話意図分類データセット(中国語)で評価しました。実験結果は、両方のデータセットにおいて提案モデルが既存の最先端手法を大幅に上回ることを示しており、少ショットテキスト分類におけるクラスレベル的一般化の有効性を証明しています。