17일 전
TFCNs: 의료 영상 분할을 위한 CNN-Transformer 하이브리드 네트워크
Zihan Li, Dihan Li, Cangbai Xu, Weice Wang, Qingqi Hong, Qingde Li, Jie Tian

초록
의료 영상 분할은 의료 정보 분석과 관련된 가장 기초적인 작업 중 하나이다. 지금까지 다양한 해결책이 제안되었으며, U-Net, FC-DenseNet 등과 같은 많은 딥러닝 기반 기법들이 포함되어 있다. 그러나 의료 영상 내부에 존재하는 고유한 확대 및 왜곡 현상과 정상 조직과 밀도가 유사한 병변의 존재로 인해, 고정밀도 의료 영상 분할은 여전히 매우 도전적인 과제로 남아 있다. 본 논문에서는 FC-DenseNet에 ResLinear-Transformer(이하 RL-Transformer)와 Convolutional Linear Attention Block(이하 CLAB)을 도입함으로써 이 문제를 해결하기 위한 TFCNs(Transformer를 활용한 완전 컨볼루션 밀집망)를 제안한다. TFCNs는 CT 영상에서 더 많은 잠재적 정보를 특징 추출에 활용할 수 있을 뿐만 아니라, CLAB 모듈을 통해 의미 있는 특징을 효과적으로 포착하고 전파하며, 비의미적 특징을 더 잘 필터링할 수 있다. 실험 결과, TFCNs는 Synapse 데이터셋에서 83.72%의 Dice 스코어를 달성하여 최신 기술 수준의 성능을 보였다. 또한, COVID-19 공개 데이터셋을 활용하여 병변 영역의 영향에 대한 TFCNs의 견고성도 평가하였다. 본 연구의 파이썬 코드는 https://github.com/HUANGLIZI/TFCNs에서 공개될 예정이다.