11일 전

CDeC-Net: 문서 이미지 내 표 감지용 복합 변형 캐스케이드 네트워크

Madhav Agarwal, Ajoy Mondal, C. V. Jawahar
CDeC-Net: 문서 이미지 내 표 감지용 복합 변형 캐스케이드 네트워크
초록

문서 이미지에서 표, 그림, 수식 등 페이지 요소를 정확히 위치시키는 것은 정보 추출의 핵심 단계이다. 본 연구에서는 문서 내 존재하는 표를 탐지하기 위해, 종단 간(end-to-end) 훈련이 가능한 새로운 딥 네트워크(CDeC-Net)를 제안한다. 제안된 네트워크는 다단계 확장된 Mask R-CNN 아키텍처를 기반으로 하며, 변형 가능한 컨볼루션(deformable convolution)을 갖춘 이중 백본(dual backbone)을 채택하여 다양한 규모의 표를 고정밀도로 탐지할 수 있다. 특히, 높은 IoU(Intersection over Union) 임계값에서도 뛰어난 탐지 정확도를 보인다. 우리는 ICDAR-2013, ICDAR-2017, ICDAR-2019, UNLV, Marmot, PubLayNet, TableBank 등 공개된 모든 기준 데이터셋에 대해 광범위한 실험을 통해 CDeC-Net의 실증적 성능을 평가하였다.본 연구의 솔루션은 세 가지 중요한 특성을 갖는다: (i) 하나의 훈련된 모델인 CDeC-Net‡가 모든 주요 기준 데이터셋에서 우수한 성능을 보인다; (ii) 다양한 IoU 임계값, 특히 높은 임계값에서도 뛰어난 성능을 기록한다; (iii) 각 데이터셋에 대해 최근 논문들에서 사용하는 동일한 평가 프로토콜을 따르며, 일관되게 우수한 정량적 성능을 입증한다. 본 연구의 코드와 모델은 결과의 재현 가능성을 보장하기 위해 공개될 예정이다.

CDeC-Net: 문서 이미지 내 표 감지용 복합 변형 캐스케이드 네트워크 | 최신 연구 논문 | HyperAI초신경