11日前

最適輸送を用いたニューラルトピックモデル

He Zhao, Dinh Phung, Viet Huynh, Trung Le, Wray Buntine
最適輸送を用いたニューラルトピックモデル
要約

近年、変分自己符号化器(VAE)をモデルとして用いるニューラルトピックモデル(NTM)は、テキスト解析において優れた成果を上げたことから、研究者の関心が高まっている。しかし、従来のNTMは、文書表現の質とトピックの一貫性・多様性を同時に達成することが難しく、特に短文に対して性能が著しく低下する傾向がある。また、再パラメータ化(reparameterization)の要件が、モデルの訓練品質や柔軟性を損なう要因となることも指摘されている。こうした課題を解決するため、本研究では最適輸送(Optimal Transport, OT)理論に基づく新しいニューラルトピックモデルを提案する。具体的には、文書のトピック分布を、その文書の語分布とのOT距離を直接最小化することで学習する手法を提案する。重要な点として、OT距離のコスト行列は、埋め込み空間におけるトピックと語の間の距離から構築される重みをモデル化しており、トピックと語の関係性を明確に表現できる。本モデルは微分可能な損失関数を用いて効率的に訓練可能である。広範な実験結果から、本フレームワークは従来の最先端NTMと比較して、通常のテキストおよび短文の両方において、より一貫性があり多様なトピックを発見し、より優れた文書表現を獲得できることが明らかになった。

最適輸送を用いたニューラルトピックモデル | 最新論文 | HyperAI超神経