17일 전

야생 환경에서 투명 물체의 세그멘테이션

Enze Xie, Wenjia Wang, Wenhai Wang, Mingyu Ding, Chunhua Shen, Ping Luo
야생 환경에서 투명 물체의 세그멘테이션
초록

유리로 제작된 창문이나 병과 같은 투명 물체는 실제 세계에서 널리 존재한다. 이러한 물체의 세그멘테이션은 배경 이미지로부터 유래한 다양한 외관 특성을 지니고 있어 주변 환경과 유사한 외관을 보이기 때문에 도전적인 과제이다. 이 작업의 기술적 난이도 외에도, 이 문제를 탐구하기 위해 특별히 설계되고 수집된 이전 데이터셋은 극히 적으며, 대부분의 기존 데이터셋은 심각한 한계를 지닌다. 예를 들어, 수천 장의 이미지에 불과하고 수동 레이블링이 없는 경우가 많거나, 컴퓨터 그래픽 기법으로 생성된 이미지(즉, 실제 이미지가 아닌)로만 구성된 경우가 있다. 이 중요한 문제를 해결하기 위해 본 연구는 실세계 시나리오의 10,428개 이미지를 포함하고 있으며, 정교한 수동 레이블링이 수행된 대규모 투명 물체 세그멘테이션 데이터셋인 Trans10K를 제안한다. 기존 데이터셋보다 10배 이상 규모가 큰 이 데이터셋은 다양한 크기, 시점, 가림 현상 등으로 인해 매우 도전적인 투명 물체들을 포함하고 있다(그림 1 참조). Trans10K의 효과를 평가하기 위해, 경계 정보를 활용하여 투명 물체의 세그멘테이션 성능을 향상시키는 새로운 경계 인식 세그멘테이션 방법인 TransLab을 제안한다. 광범위한 실험과 아블레이션 연구를 통해 Trans10K의 효과성과 TransLab에서 객체 경계를 학습하는 실용성 모두를 입증하였다. 예를 들어, TransLab은 딥러닝 기반의 최근 20개의 객체 세그멘테이션 방법보다 뚜렷하게 우수한 성능을 보이며, 이 작업이 여전히 크게 해결되지 않은 과제임을 시사한다. 우리는 Trans10K와 TransLab이 학계와 산업 모두에 중요한 기여를 할 것이라 믿으며, 향후 연구 및 응용 발전을 촉진할 것으로 기대한다.