HyperAIHyperAI

Command Palette

Search for a command to run...

少ショットテキスト分類のための誘導ネットワーク

Ruiying Geng; Binhua Li; Yongbin Li; Xiaodan Zhu; Ping Jian; Jian Sun

概要

テキスト分類は、データが不足している場合や未見のクラスに適応する必要がある場合に困難を伴います。このような課題的なシナリオでは、最近の研究でメタ学習が用いられ、新しいクエリがサンプルレベルで小さなサポートセットと比較される少ショットタスクをシミュレートしています。しかし、このサンプルレベルでの比較は、同じクラス内の様々な表現によって著しく乱される可能性があります。したがって、各クラスの一般的な表現をサポートセットから学習し、それを新しいクエリと比較することが望ましいです。本論文では、メタ学習において動的ルーティングアルゴリズムを革新的に活用することで、このような一般的なクラスレベルの表現を学習する新たな誘導ネットワーク(Induction Network)を提案します。これにより、モデルがより良く誘導され一般化することが確認されました。提案されたモデルは、よく研究されている感情分類データセット(英語)と実世界の対話意図分類データセット(中国語)で評価しました。実験結果は、両方のデータセットにおいて提案モデルが既存の最先端手法を大幅に上回ることを示しており、少ショットテキスト分類におけるクラスレベル的一般化の有効性を証明しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています