2달 전
TSRFormer: Transformer를 활용한 표 구조 인식
Weihong Lin; Zheng Sun; Chixiang Ma; Mingze Li; Jiawei Wang; Lei Sun; Qiang Huo

초록
우리는 다양한 표 이미지에서 기하학적 왜곡이 있는 복잡한 표의 구조를 강건하게 인식하기 위한 새로운 표 구조 인식(TSR) 접근법인 TSRFormer를 제시합니다. 이전 방법들과 달리, 우리는 표 분리선 예측을 이미지 세그멘테이션 문제가 아닌 선 회귀 문제로 정식화하고, 이를 직접적으로 표 이미지에서 분리선을 예측하는 새로운 두 단계 DETR 기반 분리선 예측 접근법인 Separator REgression TRansformer (SepRETR)를 제안합니다. 두 단계 DETR 프레임워크가 분리선 예측 작업에 효율적이고 효과적으로 작동하도록 하기 위해, 다음과 같은 두 가지 개선점을 제안합니다: 1) DETR의 느린 수렴 문제를 해결하기 위한 사전 정보 강화 매칭 전략; 2) 고해상도 컨볼루셔널 특징 맵에서 특징을 직접 샘플링하여 저 컴퓨테이션 비용으로 높은 위치 결정 정확도를 달성할 수 있는 새로운 크로스 어텐션 모듈.분리선 예측 후, 간단한 관계 네트워크 기반 셀 병합 모듈을 사용하여 확장 셀을 복원합니다. 이러한 새로운 기술들을 통해 우리의 TSRFormer는 SciTSR, PubTabNet 및 WTW와 같은 여러 벤치마크 데이터셋에서 최고 수준의 성능을 달성하였습니다. 또한, 더 도전적인 실세계 내부 데이터셋에서 우리 접근법의 복잡한 구조, 경계 없는 셀, 큰 공백 공간, 빈 또는 확장된 셀, 왜곡되거나 심지어 곡선 형태의 표에 대한 강건성을 검증하였습니다.