17일 전

EPYNET: 의류 세그멘테이션을 위한 효율적인 피라미드형 네트워크

{Heitor Silvério Lopes, Andrei De Souza Inácio}
초록

인체에서 추출되는 소프트 생체 정보 특성, 예를 들어 옷의 종류, 헤어 컬러, 액세서리 등은 사람 추적 및 식별에 유용한 정보로 활용된다. 이러한 특성에 대한 이미지에서의 의미적 세분화는 옷의 스타일, 겹침, 형태, 색상 등 다양성의 영향으로 여전히 연구자들에게 도전 과제로 남아 있다. 이러한 문제를 해결하기 위해 본 연구에서는 옷 분할을 위한 EPYNET 프레임워크를 제안한다. EPYNET는 Single Shot MultiBox Detector(SSD)와 Feature Pyramid Network(FPN)을 기반으로 하며, 백본으로 EfficientNet 모델을 사용한다. 또한, 데이터 증강 기법과 노이즈 제거 기술을 통합하여 분할 정확도를 향상시킨다. 더불어, 18개의 객체 클래스와 배경을 포함하여 총 4,500개의 수동으로 주석이 달린 이미지로 구성된 새로운 데이터셋 UTFPR-SBD3를 제안한다. 기존 공개 데이터셋들이 클래스 분포가 불균형한 반면, UTFPR-SBD3는 각 클래스에 최소 100개 이상의 인스턴스를 포함하여 딥러닝 모델의 학습 난이도를 최소화한다. 옷 분할을 위한 다양한 데이터셋 간 비교의 어려움을 고려하여, 새로운 데이터셋 불균형 측정 지표를 제안하였다. 이 지표를 통해 배경의 영향, 작은 물체를 포함한 클래스, 또는 인스턴스 수가 지나치게 많거나 적은 클래스의 영향을 탐지할 수 있다. UTFPR-SBD3에 대한 실험 결과는 EPYNET의 효과성을 입증하며, 공개 데이터셋에서 기존 최고 성능(SOTA) 방법들을 상회하는 성능을 보였다. 이러한 결과를 바탕으로, 제안된 방법은 소프트 생체 정보, 사람 감시, 이미지 설명, 의류 추천 등 다양한 실용적 응용 분야에 유용할 것으로 기대된다.