2달 전

TableNet: 스캔된 문서 이미지에서 단계별 테이블 검출 및 표 데이터 추출을 위한 딥러닝 모델

Shubham Paliwal; Vishwanath D; Rohit Rahul; Monika Sharma; Lovekesh Vig
TableNet: 스캔된 문서 이미지에서 단계별 테이블 검출 및 표 데이터 추출을 위한 딥러닝 모델
초록

모바일 폰과 스캐너의 광범위한 사용으로 인해 소매 영수증, 보험 청구서, 금융 발행서류와 같은 비정형 문서 이미지에 갇혀 있는 정보를 추출할 필요성이 점점 더 시급해지고 있습니다. 이러한 목표를 달성하는 데 큰 장애물은 이들 이미지가 종종 표 형태의 정보를 포함하고 있으며, 표 하위 이미지에서 데이터를 추출하는 것이 독특한 도전 과제를 제시한다는 것입니다. 이는 이미지 내의 표 영역을 정확히 감지하고, 이후 감지된 표의 행과 열에서 정보를 감지하고 추출하는 것을 포함합니다. 표 감지는 일부 진전이 이루어졌지만, 표 내용을 추출하는 것은 여전히 도전적인 문제입니다. 이는 더욱 세부적인 표 구조(행 및 열) 인식을 필요로 하기 때문입니다. 기존 접근 방식들은 두 개의 별도 모델을 사용하여 표 감지와 구조 인식 문제를 독립적으로 해결하려고 시도했습니다. 본 논문에서는 TableNet: 표 감지와 구조 인식을 모두 수행하는 혁신적인 엔드투엔드 딥러닝 모델을 제안합니다. 이 모델은 표 감지와 표 구조 인식이라는 두 가지 작업 사이의 상호 의존성을 활용하여 표와 열 영역을 분할합니다. 이어서 식별된 표 하위 영역에서 의미론적 규칙 기반으로 행을 추출합니다. 제안된 모델과 추출 방법은 공개된 ICDAR 2013 및 Marmot Table 데이터셋에서 최상의 결과를 얻어 평가되었습니다. 또한 추가적인 의미론적 특징을 입력함으로써 모델 성능이 더욱 향상되고, 모델이 데이터셋 간 전이 학습을 나타냄을 입증하였습니다. 본 논문의 또 다른 기여는 Marmot 데이터에 대한 추가적인 표 구조 주석 제공입니다. 현재 이 데이터는 단순히 표 감지를 위한 주석만 가지고 있습니다.

TableNet: 스캔된 문서 이미지에서 단계별 테이블 검출 및 표 데이터 추출을 위한 딥러닝 모델 | 최신 연구 논문 | HyperAI초신경