StyleGAN2-ADAの医用画像に対する性能評価

生成的対抗ネットワーク(GAN)は医療画像分野において有望な成果を示しているものの、計算コスト、データ要件、信頼性の高い評価指標、および訓練の複雑性という4つの主要な制約により、その実用性が阻害されてきた。本研究では、StyleGAN2-ADAを高解像度医療画像データセットに新たな応用することで、これらの課題をそれぞれ検証した。使用したデータセットは、造影なしおよび造影強調CTスキャンから得られた肝臓を含む軸断層画像から構成されており、さらに4つの公開データセット(異なる画像モダリティを含む)も併用した。StyleGAN2ネットワークは、Flickr-Faces-HQデータセットからの転移学習と、水平反転および適応的ディスクリミネータ増強(ADA)を用いたデータ拡張によって訓練された。生成画像の品質は、定量的評価としてFréchet Inception Distance(FID)を用い、定性的評価として7名の放射線科医および放射線腫瘍科医に実施した視覚的チューリングテストによって評価した。StyleGAN2-ADAは、肝臓CTデータセットにおいてFID 5.22(±0.17)を達成し、公開データセットであるSLIVER07、ChestX-ray14、ACDC、Medical Segmentation Decathlon(脳腫瘍)においても、それぞれFID 10.78、3.52、21.17、5.39という新たな記録を樹立した。視覚的チューリングテストでは、臨床医が生成画像を「実画像」と判定した割合は42%に達し、ランダムな推測に近い結果となった。計算負荷に関するアブレーション研究から、転移学習およびデータ拡張が訓練の安定性を高め、生成画像の知覚的品質を向上させることを確認した。また、FIDの値が医療画像の人的知覚評価と一貫していることも観察された。最終的に、本研究はStyleGAN2-ADAがハイパーパラメータの最適化や再訓練を一切行わずに、一貫して高品質な生成結果を提供できることを明らかにした。