13日前

双方向 adversarial 訓練を用いたニューラルトピックモデリング

Rui Wang, Xuemeng Hu, Deyu Zhou, Yulan He, Yuxuan Xiong, Chenchen Ye, Haiyang Xu
双方向 adversarial 訓練を用いたニューラルトピックモデリング
要約

近年、従来のトピックモデル(例えば、潜在ディリクレ割り当て:LDA)におけるモデル推論に必要な複雑な数学的導出を回避できる点から、神経トピックモデルを用いたテキストからの自動トピック抽出に対する関心が急増している。しかし、既存のモデルは通常、潜在トピック空間に不適切な事前分布(例えばガウス分布やロジスティック正規分布)を仮定するか、与えられた文書に対してトピック分布を推論できないという課題を抱えている。これらの制約を克服するため、本研究では、神経トピックモデルにおける双方向 adversarial 学習の初めての試みとして、双方向 adversarial トピック(Bidirectional Adversarial Topic; BAT)モデルを提案する。本モデルは、文書-トピック分布と文書-単語分布の間で双方向の射影を構築する。生成器(generator)によりテキストから意味的パターンを捉え、エンコーダー(encoder)によりトピック推論を実現する。さらに、単語間の関連性情報を組み込むために、BATを拡張したガウス分布を用いた双方向 adversarial トピックモデル(Gaussian-BAT)を提案する。BATおよびGaussian-BATの有効性を検証するため、3つのベンチマークコーパスを用いた実験を行った。実験結果から、BATおよびGaussian-BATは、複数の競合モデルを上回る一貫性の高いトピックを生成することが明らかになった。また、抽出されたトピックに基づくテキストクラスタリングにおいても、本モデルはすべてのベースラインを上回り、特にGaussian-BATは分類精度において約6%の顕著な向上が確認された。

双方向 adversarial 訓練を用いたニューラルトピックモデリング | 最新論文 | HyperAI超神経