HyperAIHyperAI

Command Palette

Search for a command to run...

自己学習型畳み込みニューラルネットワークを用いた短文クラスタリング

Jiaming Xu Bo Xu* Peng Wang Suncong Zheng Guanhua Tian Jun Zhao Bo Xu

概要

短文クラスタリングは、テキスト表現の疎さ(sparseness)により難題となっています。本稿では、短文クラスタリングに向けた柔軟な自己教授型畳み込みニューラルネットワークフレームワーク(Self-Taught Convolutional neural network for Short Text Clustering、以下STC^2と呼ぶ)を提案します。このフレームワークは、有用な意味論的特徴をより柔軟かつ成功裏に組み込み、非監督的な方法で偏りのない深いテキスト表現を学習することができます。当該フレームワークにおいては、まず既存の非監督次元削減手法を使用して、元の生テキスト特徴量をコンパクトなバイナリコードに埋め込みます。次に、単語埋め込みが探索され、畳み込みニューラルネットワークに入力されて深い特徴表現を学習します。一方で、訓練プロセス中に出力ユニットが事前学習済みのバイナリコードに適合するように利用されます。最後に、K平均法を使用して学習された表現をクラスタリングし、最適なクラスタを得ます。広範囲にわたる実験結果は、提案したフレームワークが効果的であり、柔軟性があり、3つの公開短文データセットでのテストにおいていくつかの人気のあるクラスタリング手法を上回ることを示しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています