2ヶ月前
IPC: グラフ構造データの学習用ベンチマークデータセット
Patrick Ferber; Tengfei Ma; Siyu Huo; Jie Chen; Michael Katz

要約
ベンチマークデータセットは、グラフベースの機械学習手法の評価において欠かせない要素です。本研究では、国際計画競技(IPC)から編纂した新しいデータセットを公開し、グラフ分類、回帰および関連タスクのベンチマークに使用することを提案します。このデータセットは、AI計画問題に基づくグラフ構築が独自に興味深いだけでなく、一般的に使用されているベンチマークとは明確に異なる特性を持っています。このデータセットは「IPC」と命名され、グラウンド版とリフト版という2つの独立したバージョンで構成されています。両バージョンとも大規模かつ偏った分布を持つグラフを含んでおり、グラフカーネルやグラフニューラルネットワークなどのグラフモデルの計算にとって大きな課題となっています。このデータセットのグラフは有向であり、リフト版は非循環であるため、有向(非循環)構造に特化したモデルのベンチマークを行う機会が提供されます。さらに、グラフジェネレータとラベリングはコンピュータプログラムによって生成されるため、より大規模なデータが必要な場合にも容易に拡張することができます。このデータセットは以下のURLからアクセス可能です: \url{https://github.com/IBM/IPC-graph-data}。