2달 전

확대 불변 의료 이미지 분석: 컨벌루션 네트워크, 비전 트랜스포머, 및 토큰 믹서의 비교

Pranav Jeevan; Nikhil Cherian Kurian; Amit Sethi
확대 불변 의료 이미지 분석: 컨벌루션 네트워크, 비전 트랜스포머, 및 토큰 믹서의 비교
초록

컨벌루션 신경망(CNNs)은 의료 이미지 분석에 널리 사용되지만, 테스트 이미지의 배율이 학습 이미지와 다르면 성능이 저하됩니다. CNNs가 배율 스케일을 일반화하지 못하면 외부 데이터셋에서 최적의 성능을 발휘하지 못할 수 있습니다. 본 연구는 다양한 딥러닝 아키텍처가 학습 및 테스트 단계에서 배율 스케일이 다른 유방암 조직학적 이미지를 분석하는 데 있어서의 견고성을 평가하는 것을 목표로 합니다. 여기서는 CNN 기반 ResNet과 MobileNet, 자기 주의(self-attention) 기반 비전 트랜스포머(Vision Transformers)와 Swin 트랜스포머, 토큰 혼합(token-mixing) 모델인 FNet, ConvMixer, MLP-Mixer, 그리고 WaveMix 등의 여러 딥러닝 아키텍처의 성능을 탐색하고 비교합니다. 실험은 다양한 배율 수준의 유방암 조직학적 이미지를 포함하는 BreakHis 데이터셋을 사용하여 수행되었습니다. 결과적으로 WaveMix의 성능은 학습 및 테스트 데이터의 배율에 영향을 받지 않으며 안정적이고 우수한 분류 정확도를 제공할 수 있음을 보였습니다. 이러한 평가는 해부학적 구조 간 배율 변화가 추론 결과를 방해하지 않도록 하는 데 있어 견고하게 배율 스케일 변화를 처리할 수 있는 딥러닝 아키텍처를 식별하는 데 중요합니다.

확대 불변 의료 이미지 분석: 컨벌루션 네트워크, 비전 트랜스포머, 및 토큰 믹서의 비교 | 최신 연구 논문 | HyperAI초신경