15日前
新しいグラフノード分類ベンチマーク:ヒストロロジー細胞グラフからの構造学習
Claudia Vanea, Jonathan Campbell, Omri Dodi, Liis Salumäe, Karen Meir, Drorith Hochner-Celnikier, Hagit Hochner, Triin Laisk, Linda M. Ernst, Cecilia M. Lindgren, Christoffer Nellåker

要約
我々は、胎盤組織の全スライド画像(whole slide images)における細胞グラフから微細解剖的組織構造を予測するという、未だ十分に研究が進んでいない分野におけるノード分類のための新しいベンチマークデータセット「Placenta」を紹介する。この問題は、グラフ学習において幾つかの点で特異な難しさを有している。まず、細胞グラフは非常に巨大であり、1枚の画像あたり100万ノード以上を有する。次に、ノード特徴量は多様であり、11種類の細胞について64次元の特徴量が用いられる。さらに、クラスラベルの分布は極めて不均衡であり(9クラス、データ全体の0.21%から40.0%まで)、細胞のコミュニティは、1構造あたり11ノードから44,671ノードまでと、著しく多様なサイズで不均一に分布する組織に集団化する。本研究では、2枚の胎盤組織画像から構成される2つの細胞グラフからなるデータセットを公開する。このデータセットは合計2,395,747ノードを含み、そのうち799,745ノードに真値ラベルが付与されている。また、スケーラブルな7種類のモデルに対する誘導的(inductive)ベンチマーク結果を提示し、細胞グラフが有する特異な性質が、新たなグラフニューラルネットワークアーキテクチャの開発を促進する可能性を示す。