9日前

HSCNN:極端に不均衡なマルチラベルテキスト分類のためのハイブリッドシアンセイ畳み込みニューラルネットワーク

{Yanming Ye, Fumiyo Fukumoto, Jiyi Li, Wenshuo Yang}
HSCNN:極端に不均衡なマルチラベルテキスト分類のためのハイブリッドシアンセイ畳み込みニューラルネットワーク
要約

データの不均衡問題は、多ラベルテキスト分類において重要な課題である。既存のいくつかの研究では、単純な交差エントロピー損失に代えて不均衡損失関数を提案することでこの問題に取り組んできたが、極端に不均衡なデータにおいてはその性能は依然として限界に達している。本研究では、ヘッドカテゴリ(頻度の高いカテゴリ)に対して一般的なネットワークを適応させ、テールカテゴリ(頻度の低いカテゴリ)に対して少サンプル学習(few-shot)技術を適用するハイブリッドアプローチを提案する。具体的には、単一ネットワークとシameseネットワークを統合したマルチタスクアーキテクチャを備えた、ハイブリッド・シamese畳み込みニューラルネットワーク(HSCNN)を設計した。本モデルは、以下の技術的特徴を有する:(1)単一ネットワークとシameseネットワークに基づくマルチタスク構造、(2)シamese構造におけるカテゴリ固有の類似性評価、(3)HSCNNの学習に特化したサンプリング手法。2つのベンチマークデータセットおよび3種類の損失関数を用いた実験結果から、本手法は、異なる損失関数を用いた単一ネットワークの性能を、特にテールカテゴリまたは全体のカテゴリにおいて顕著に向上させることができることが示された。

HSCNN:極端に不均衡なマルチラベルテキスト分類のためのハイブリッドシアンセイ畳み込みニューラルネットワーク | 最新論文 | HyperAI超神経