17일 전
야생에서의 표 탐지: 새로운 다양성 표 탐지 데이터셋 및 방법
Mrinal Haloi, Shashank Shekhar, Nikhil Fande, Siddhant Swaroop Dash, Sanjay G

초록
최근의 딥러닝 기반 표 탐지 기법들은 뛰어난 성능을 달성하며 문서 레이아웃을 식별하는 데 효과적임을 입증하였다. 그러나 현재 공개된 표 탐지 평가 기준들은 표본의 다양성 부족, 단순한 표 구조, 학습 사례 부족, 그리고 표본 품질 문제 등 여러 한계를 가지고 있다. 본 논문에서는 다양한 출처에서 수집한 7,000개 이상의 표본을 포함하고 있으며, 다양한 종류의 표 구조를 갖춘 대규모 다각적 표 탐지 데이터셋을 제안한다. 또한, 문서 내 표 구조를 탐지하기 위해 컨볼루셔널 신경망 기반의 베이스라인 결과를 제시한다. 실험 결과는 전통적인 컴퓨터 비전 기반 방법보다 컨볼루셔널 딥러닝 기법이 우수함을 보여준다. 본 논문에서 소개하는 이 다양성 있는 표 탐지 데이터셋은 연구 공동체가 문서 레이아웃 이해 및 표 형식 데이터 처리를 위한 고처리량 딥러닝 기법을 개발하는 데 기여할 것으로 기대된다. 데이터셋은 아래 두 곳에서 제공된다:1. https://www.kaggle.com/datasets/mrinalim/stdw-dataset2. https://huggingface.co/datasets/n3011/STDW