11일 전
문서 이미지 왜곡 제거를 위한 게이트 및 분기형 스택드 U-Net 모듈
Hmrishav Bandyopadhyay, Tanmoy Dasgupta, Nibaran Das, Mita Nasipuri

초록
문서의 이미지를 캡처하는 것은 정보를 기록하는 가장 간단하고 널리 사용되는 방법 중 하나이다. 그러나 휴대용 장치를 이용해 캡처된 이러한 이미지들은 종종 원치 않는 왜곡을 동반하며, 이러한 왜곡은 제거하기가 매우 어렵다. 본 연구에서는 입력 이미지로부터 왜곡이 없는 이미지를 생성하기 위해, dewarping 그리드를 예측하는 지도 학습 기반의 게이팅된(Gated) 이중 분기형(Бifurcated) 스택형 U-Net 모듈을 제안한다. 네트워크는 합성적으로 왜곡된 문서 이미지에 대해 학습되지만, 평가 결과는 실제 세계의 이미지 기반으로 산출된다. 본 방법의 혁신성은 단순히 U-Net을 이중 분기 구조로 나누어 그리드 좌표 간의 혼잡함을 제거하는 데 그치지 않고, 경계선 및 미세한 선단 수준의 세부 정보를 모델에 추가하는 게이팅된 네트워크의 활용에 있다. 제안하는 엔드투엔드 파이프라인은 이전 방법에서 사용된 데이터의 단 8퍼센트만으로 학습됨에도 불구하고, DocUNet 데이터셋에서 최신 기준(SOTA, State-of-the-art) 성능을 달성하였다.