グラフレベルのタスクにおいて、従来のGNNは強力なベースラインとなることができるか?シンプルなアーキテクチャが優れた性能を実現する

メッセージパッシング型グラフニューラルネットワーク(GNN)は、表現力の制限や過度なスムージング、過度なクシャミング(over-squashing)といった問題、および長距離依存関係の捉えにくさといった課題から、しばしば批判されてきました。一方、グラフトランスフォーマー(GT)は、グローバルなアテンション機構を採用しているため、これらの課題を緩和できる可能性があるとして、優れた性能を持つと広く認識されています。これまでの文献では、特に小規模な分子グラフにおけるグラフ分類や回帰といったグラフレベルのタスクにおいて、GTがGNNを上回る性能を発揮すると頻繁に示唆されています。本研究では、GNN+と呼ばれる強化されたフレームワークを用いて、GNNの潜在能力を再評価しました。GNN+は、エッジ特徴の統合、正規化、ドロップアウト、残差接続、フィードフォワードネットワーク、位置符号化の6つの広く用いられている技術を統合しており、グラフレベルのタスクに対処する上で効果的です。本研究では、このGNN+フレームワークによって強化された3つの代表的なGNN(GCN、GIN、GatedGCN)を、14の代表的なグラフレベルデータセット上で系統的に再評価しました。その結果、従来の見解とは対照的に、これらの古典的GNNはGTを常に同等以上、あるいは上回る性能を発揮することが明らかになりました。すべてのデータセットで上位3位以内にランクインし、そのうち8つのデータセットでは1位を獲得しました。さらに、GTに対して数倍から数十倍の高速性を示し、計算効率の面でも優位性を発揮しました。これは、単純なGNNアーキテクチャが、複雑なGTのメカニズムに依存せずに、優れたグラフレベル性能を達成できる可能性を示しており、GTの優位性を支える要因として複雑な構造が不可欠であるという見解に疑問を呈するものです。本研究のソースコードは、https://github.com/LUOyk1999/GNNPlus にて公開されています。