17일 전
EffiSegNet: 단순화된 디코더를 갖춘 사전 훈련된 EfficientNet 기반 네트워크를 통한 위장관 폴립 세그멘테이션
Ioannis A. Vezakis, Konstantinos Georgas, Dimitrios Fotiadis, George K. Matsopoulos

초록
본 연구에서는 전이 학습을 활용한 새로운 세분화 프레임워크인 EffiSegNet을 제안한다. 이 프레임워크는 사전 훈련된 합성곱 신경망(CNN) 분류기를 백본으로 사용한다. 기존의 대칭적인 U자형 아키텍처와는 달리, EffiSegNet은 디코더를 단순화하고 전체 스케일의 특징 병합(full-scale feature fusion)을 도입함으로써 계산 비용과 파라미터 수를 최소화한다. 우리는 공개된 Kvasir-SEG 데이터셋을 이용하여 위장관 폴립 세분화 작업에서 모델 성능을 평가하였으며, 최첨단 성능을 달성하였다. 특히, 사전 훈련된 백본을 사용한 EffiSegNet-B4 네트워크 변형은 F1 점수 0.9552, 평균 Dice (mDice) 0.9483, 평균 교차율(mIoU) 0.9056, 정밀도(Precision) 0.9679, 재현율(Recall) 0.9429를 기록하였으며, 이는 해당 데이터셋에 대해 현재까지 보고된 최고 수준의 성능이다. 또한, 사전 훈련 없이 처음부터 훈련한 경우에도 기존 연구 대비 뛰어난 성능을 보였으며, F1 점수 0.9286, mDice 0.9207, mIoU 0.8668, 정밀도 0.9311, 재현율 0.9262를 달성하였다. 이러한 결과는 이미지 세분화 네트워크에서 잘 설계된 인코더의 중요성과 전이 학습 접근법의 효과를 입증한다.