15日前

特徴選択:グラフニューラルネットワークを用いたノード分類の性能向上への鍵

{Tsuyoshi Murata, Xin Liu, Sunil Kumar Maurya}
要約

グラフはデータ内のエンティティ間の関係を定義するのに役立ちます。これらの関係はエッジによって表現され、しばしば追加の文脈情報を提供し、データ内のパターンを発見する際に活用できます。グラフニューラルネットワーク(GNN)は、グラフ構造に内在する誘導的バイアス(inductive bias)を活用して、さまざまなタスクにおける学習と予測を行います。GNNの主な演算は、グラフの構造に基づいてノードの近傍ノードに対して実施される特徴量の集約(aggregation)です。各ノードは自身の特徴量に加えて、各ホップ(hop)ごとに近傍ノードからの追加の組み合わせ特徴量を取得します。これらの集約された特徴量は、ノード間のラベルに対する類似性や非類似性を定義するのに役立ち、ノード分類などのタスクにおいて有効です。しかし、現実世界のデータでは、異なるホップにおける近傍ノードの特徴量が、中心ノードの特徴量と相関しない場合があります。したがって、GNNが特徴量を無差別に集約すると、ノイズを含む特徴量が加わる可能性があり、モデル性能の低下を引き起こすおそれがあります。本研究では、異なるホップからのノード特徴量を選択的に集約することで、従来の無差別な集約手法に比べてノード分類タスクにおける性能が向上することを示します。さらに、分類器モデルと選択器モデルを備えた「Dual-Net GNN」アーキテクチャを提案します。分類器モデルは入力ノード特徴量のサブセットを用いてノードラベルを予測する一方、選択器モデルは分類器に最適な入力特徴量サブセットを学習し提供する役割を果たします。これらの2つのモデルは共同で学習され、ノードラベル予測の精度を最大化する最適な特徴量サブセットを学習します。広範な実験を通じて、本研究で提案するモデルが、従来の特徴選択手法および最先端のGNNモデルを大きく上回り、最高で27.8%の顕著な性能向上を達成することを実証しました。

特徴選択:グラフニューラルネットワークを用いたノード分類の性能向上への鍵 | 最新論文 | HyperAI超神経