17일 전

Trans2Unet: 신경망 융합을 통한 세포핵 세분할

Dinh-Phu Tran, Quoc-Anh Nguyen, Van-Truong Pham, Thi-Thao Tran
Trans2Unet: 신경망 융합을 통한 세포핵 세분할
초록

핵 세그멘테이션은 조직병리학적 영상 분석에서 핵심적인 역할을 하며, 여전히 도전적인 과제로 남아 있다. 이 작업의 주요 과제는 겹치는 영역이 존재하기 때문에 독립적인 핵을 분리하는 것이 더욱 복잡해진다는 점이다. 본 논문에서는 Unet과 TransUnet 네트워크를 결합하여 새로운 이중 브랜치 아키텍처인 Trans2Unet을 제안한다. 제안된 아키텍처에서, 입력 영상은 먼저 Unet 브랜치로 전달되며, 마지막 합성곱 층은 제거된다. 이 브랜치는 입력 영상의 다양한 공간 영역에서 특징을 결합하고 관심 영역을 보다 정밀하게 위치화하는 데 기여한다. 동시에 입력 영상은 두 번째 브랜치인 TransUnet 브랜치로도 전달된다. TransUnet 브랜치에서는 입력 영상이 여러 영상 패치로 나누어지며, 아키텍처 내에 포함된 비전 트랜스포머(Vision Transformer, ViT)를 통해 의료 영상 세그멘테이션 작업에 강력한 인코더 역할을 수행하고, 국소적인 공간 정보를 복원함으로써 영상의 세부 정보를 향상시킨다. Trans2Unet의 효율성과 성능을 향상시키기 위해, ‘워터폴(Waterfall) 아트로스 공간 풀링(WASP) 모듈’에 영감을 받은 계산 효율성이 뛰어난 변형인 ‘워터폴 아트로스 공간 풀링과 스케이프 연결(WASP-KC) 모듈’을 TransUnet에 도입하였다. 2018년 데이터 사이언스 볼(benchmark)에서 수행된 실험 결과는 제안된 아키텍처가 기존 세그멘테이션 모델들과 비교하여 우수한 효과와 성능을 보임을 입증하였다.