의료 영상에서 StyleGAN2-ADA의 성능 평가

생성적 적대 신경망(GAN)은 의료 영상 분야에서 잠재력을 보여주고 있으나, 계산 비용, 데이터 요구량, 신뢰할 수 있는 평가 지표, 학습 복잡성이라는 네 가지 주요한 한계로 인해 실용성에 제약이 있었다. 본 연구에서는 이러한 장애 요소들을 새로운 응용 방식인 StyleGAN2-ADA를 활용하여 고해상도 의료 영상 데이터셋에 적용하여 체계적으로 탐구하였다. 본 연구에서 사용한 데이터셋은 비대조 및 대조 강화 전산화단층촬영(CT) 스캔에서 추출한 간을 포함하는 축방향 절단 영상으로 구성되어 있으며, 추가적으로 다양한 영상 모달리티를 포함한 네 가지 공개 데이터셋도 활용하였다. 우리는 Flickr-Faces-HQ 데이터셋에서의 전이학습(transfer learning)과 데이터 증강(수평 반전 및 적응형 디스크리미너 증강)을 통해 StyleGAN2 네트워크를 학습시켰다. 네트워크의 생성 품질은 Fréchet Inception Distance(FID)를 통한 정량적 평가와, 7명의 방사선 전문의 및 방사선 종양 전문의에게 실시한 시각적 튜링 테스트를 통해 정성적으로 평가하였다.StyleGAN2-ADA는 본 연구에서 사용한 간 CT 데이터셋에서 FID 5.22(±0.17)의 성능을 달성하였으며, 공개된 SLIVER07, ChestX-ray14, ACDC, Medical Segmentation Decathlon(뇌종양) 데이터셋에서는 각각 10.78, 3.52, 21.17, 5.39의 새로운 기록 FID를 기록하였다. 시각적 튜링 테스트 결과, 임상 전문가들은 생성된 이미지를 실제 영상으로 잘못 인식하는 경우를 42%의 비율로 기록하였으며, 이는 무작위 추측 수준에 근접하는 결과였다. 계산 복잡성 분석을 통해 전이학습과 데이터 증강이 학습 안정성과 생성 이미지의 인지적 품질 향상에 기여하는 것으로 확인되었다. 또한 FID 값이 의료 영상에 대한 인간의 인지적 평가와 일관성을 보임을 관찰하였다. 마지막으로, 본 연구는 StyleGAN2-ADA가 하이퍼파라미터 탐색이나 재학습 없이도 일관되게 고품질 결과를 생성함을 발견하였다.