2달 전

CascadeTabNet: 이미지 기반 문서에서 테이블 검출 및 구조 인식을 위한 단계적 접근 방식

Devashish Prasad; Ayan Gadpal; Kshitij Kapadni; Manish Visave; Kavita Sultanpure
CascadeTabNet: 이미지 기반 문서에서 테이블 검출 및 구조 인식을 위한 단계적 접근 방식
초록

문서 이미지에서 표 데이터 해석을 위한 자동 표 인식 방법은 주로 표 검출과 표 구조 인식의 두 가지 문제를 해결하는 것을 포함합니다. 이전 연구에서는 두 가지 문제를 독립적으로 해결하기 위해 별도의 접근 방식을 사용했습니다. 최근 연구들은 딥 러닝 기반 솔루션을 사용하면서 동시에 종단간(end to end) 솔루션 설계를 시도하고 있습니다. 본 논문에서는 단일 컨벌루션 신경망(CNN) 모델을 사용하여 표 검출과 구조 인식의 두 가지 문제를 모두 해결하기 위한 개선된 딥 러닝 기반 종단간 접근 방식을 제시합니다. 우리는 CascadeTabNet: 캐스케이드 마스크 지역 기반 CNN 고해상도 네트워크(Cascade mask R-CNN HRNet) 기반 모델을 제안합니다. 이 모델은 표의 영역을 검출하고 동시에 해당 표에서 구조적 본문 셀들을 인식합니다. 우리의 결과는 ICDAR 2013, ICDAR 2019 및 TableBank 공개 데이터셋에서 평가되었습니다. 우리는 ICDAR 2019 경진대회 후 결과에서 표 검출 부문 3위를 차지했으며, ICDAR 2013 및 TableBank 데이터셋에서는 최고의 정확도 결과를 달성했습니다. 또한, ICDAR 2019 표 구조 인식 데이터셋에서도 가장 높은 정확도 결과를 얻었습니다. 우리는 효과적인 전이 학습(transfer learning) 및 이미지 증강(image augmentation) 기술이 CNN이 매우 정확한 표 검출 결과를 달성할 수 있도록 하는 방법을 보여주었습니다. 코드와 데이터셋은 다음 링크에서 제공됩니다: https://github.com/DevashishPrasad/CascadeTabNet

CascadeTabNet: 이미지 기반 문서에서 테이블 검출 및 구조 인식을 위한 단계적 접근 방식 | 최신 연구 논문 | HyperAI초신경