半教師付きグラフ分類:階層的グラフの視点から

ノード分類とグラフ分類は、それぞれグラフのノードのクラスラベルとグラフ全体のクラスラベルを予測する2つのグラフ学習問題です。グラフのノードは通常、現実世界のエンティティを表します。例えば、ソーシャルネットワークにおけるユーザー、またはプロテイン-プロテイン相互作用ネットワークにおけるタンパク質などです。本研究では、より挑戦的だが実用的な設定を考えます。この設定では、ノード自体がグラフのインスタンスとなります。これにより階層的なグラフ観点が生まれ、ソーシャルネットワーク、生物学的ネットワーク、文書集合などの多くの領域で見られます。例えば、ソーシャルネットワークにおいては、共通の興味を持つ人々のグループがユーザーグループを形成し、複数のユーザーグループが相互作用や共通メンバーを通じて互いに接続されます。我々はこのような階層的なグラフにおけるノード分類問題を研究しています。ここで、「ノード」はグラフのインスタンスを指します(例:前述したユーザーグループ)。現実世界のデータではラベルがしばしば限られているため、我々は2つの新しい半教師付き解法を設計しました。これらは \underline{SE}mi-supervised gr\underline{A}ph c\underline{L}assification via \underline{C}autious/\underline{A}ctive \underline{I}teration(略してSEAL-C/AI)と呼ばれています。SEAL-C/AI は反復フレームワークを採用しており、2つの分類器を交互に構築または更新します。1つはグラフインスタンスレベルで動作し、もう1つは階層的なグラフレベルで動作します。階層的なグラフ表現を簡素化するために、我々は任意サイズのグラフインスタンスを固定長ベクトルに埋め込む新しい教師付き自己注意型グラフ埋め込み手法である SAGE を提案しました。合成データおよび Tencent QQ グループデータを使用した実験により示されたように、SEAL-C/AI は精度/Macro-F1 の面で競合する手法よりも大幅に優れており、学習された表現に対する意味のある解釈も生成しています。