
우리는 다양한 문서 이미지에서 표의 경계를 감지하고 각 표의 셀 구조를 재구성하기 위한 새로운 표 감지 및 구조 인식 접근법인 RobusTabNet을 소개합니다. 표 감지를 위해 우리는 더 높은 품질의 표 제안을 생성하기 위해 CornerNet을 새로운 영역 제안 네트워크로 사용하는 것을 제안합니다. 이는 Faster R-CNN의 표 감지 위치 정확도를 크게 향상시켰습니다. 결과적으로, 우리의 표 감지 접근법은 가벼운 ResNet-18 백본 네트워크만 사용하여 cTDaR TrackA, PubLayNet 및 IIIT-AR-13K라는 세 가지 공개 표 감지 벤치마크에서 최고 수준의 성능을 달성하였습니다.또한, 우리는 새로운 분할 및 병합 기반의 표 구조 인식 접근법을 제안합니다. 이 접근법에서는 각 검출된 표를 셀 그리드로 분할하기 위한 새로운 공간 CNN 기반 분리선 예측 모듈과 셀 그리드를 병합하여 확장 셀을 복원하는 Grid CNN 기반 셀 병합 모듈이 제안되었습니다. 공간 CNN 모듈은 전체 표 이미지에 걸쳐 문맥 정보를 효과적으로 전파할 수 있으므로, 우리 표 구조 인식기는 큰 공백 공간과 기하학적으로 왜곡된(심지어 곡선 형태의) 표를 강건하게 인식할 수 있습니다. 이러한 두 가지 기술 덕분에, 우리의 표 구조 인식 접근법은 SciTSR, PubTabNet 및 cTDaR TrackB2-Modern이라는 세 가지 공개 벤치마크에서 최고 수준의 성능을 달성하였습니다.또한, 우리는 더 어려운 내부 데이터셋에서 복잡한 구조, 큰 공백 공간, 그리고 기하학적으로 왜곡되거나 심지어 곡선 형태의 표를 인식하는 데 있어 우리 접근법의 우수성을 추가로 입증하였습니다.