17일 전

딥 메트릭 학습을 통한 이미지 공세그멘테이션 개선

Zhengwen Li, Xiabi Liu
딥 메트릭 학습을 통한 이미지 공세그멘테이션 개선
초록

딥 메트릭 학습(Depth Metric Learning, DML)은 컴퓨터 비전 작업에서 유용한 기법이다. 본 논문에서는 DML을 이미지 공분할(Image co-segmentation)에 처음으로 도입한다. 우리는 이미지 분할에 특화된 새로운 트리플릿 손실(Triplet loss)을 제안하며, 이를 간단히 IS-Triplet 손실이라 부른다. 이 손실은 기존의 이미지 분할 손실과 결합되어 사용된다. 일반적인 DML 작업이 이미지 간의 거리 메트릭을 학습하는 것과 달리, 본 연구에서는 각 픽셀을 하나의 샘플로 간주하고, 고차원 공간에서의 임베딩 특징을 이용해 트리플릿을 구성한다. 이후 IS-Triplet 손실을 최적화함으로써, 서로 다른 카테고리에 속한 픽셀 간의 거리는 동일 카테고리의 픽셀 간 거리보다 크게 유지되도록 유도함으로써, 고차원 특징 공간에서 서로 다른 카테고리의 픽셀들이 더 잘 구분되도록 한다. 또한 IS-Triplet 손실의 실현 가능한 계산을 위해 효율적인 트리플릿 샘플링 전략을 제안한다. 최종적으로 IS-Triplet 손실은 3가지 전통적인 이미지 분할 손실과 결합되어 이미지 분할을 수행한다. 제안한 방법은 이미지 공분할에 적용되었으며, SBCoseg 데이터셋과 인터넷 데이터셋에서 실험을 수행하였다. 실험 결과, 본 방법은 고차원 특징 공간에서 픽셀의 카테고리 구분력을 효과적으로 향상시켜, 더 적은 학습 에포크 수로도 기존 손실 함수의 이미지 분할 성능을 개선함을 확인할 수 있었다.

딥 메트릭 학습을 통한 이미지 공세그멘테이션 개선 | 최신 연구 논문 | HyperAI초신경