4달 전
DynaSeg: 비지도 이미지 분할을 위한 특성 유사성과 공간 연속성을 통합한 깊은 동적 융합 방법
Boujemaa Guermazi; Naimul Khan

초록
본 연구는 컴퓨터 비전에서 이미지 분할의 근본적인 과제를 다루며, 이는 다양한 응용 분야에서 중요한 역할을 합니다. 지도 학습 방법은 성능을 입증하였으나, 많은 픽셀 단위 주석에 의존하는 특성으로 인해 확장성이 제한됩니다. 우리는 이러한 문제를 해결하기 위해 특징 유사성과 공간적 연속성을 균형 있게 조정하면서 광범위한 하이퍼파라미터 튜닝에 의존하지 않는 혁신적인 비지도 이미지 분할 접근 방법인 DynaSeg(다이나세그)를 소개합니다. 전통적인 방법과 달리 DynaSeg는 동적 가중치 방식을 사용하여 파라미터 튜닝을 자동화하고, 이미지 특성에 유연하게 적응하며, 다른 분할 네트워크와의 통합을 용이하게 합니다. Silhouette Score Phase(실루엣 스코어 위상)를 도입함으로써 DynaSeg는 예측 클러스터 수가 하나로 수렴되는 저분할 실패를 방지합니다. DynaSeg는 CNN 기반 및 사전 훈련된 ResNet 특징 추출을 사용하여 계산 효율성이 높고 다른 복잡한 모델보다 더 간단합니다. 실험 결과는 최첨단 성능을 보여주며, COCO-All 및 COCO-Stuff 데이터셋에서 현재 비지도 분할 접근 방식 대비 각각 12.2%와 14.12%의 mIOU 개선을 달성하였습니다. 우리는 다섯 가지 벤치마크 데이터셋에서 정성적 및 정량적 결과를 제공하여 제안된 접근 방식의 효과성을 입증하였습니다. 코드는 https://github.com/RyersonMultimediaLab/DynaSeg 에서 확인 가능합니다.