2달 전
PingAn-VCGroup의 ICDAR 2021 과학 문헌 분석 경진대회 Task B: 표 인식을 HTML로 변환하는 솔루션
Jiaquan Ye; Xianbiao Qi; Yelin He; Yihao Chen; Dengyi Gu; Peng Gao; Rong Xiao

초록
본 논문은 ICDAR 2021 과학 문헌 파싱 경진대회 Task B: 표 인식을 HTML로 변환에 대한 우리의 해결책을 제시합니다. 우리 방법에서는 표 내용 인식 작업을 네 가지 하위 작업으로 나눕니다: 표 구조 인식, 텍스트 줄 검출, 텍스트 줄 인식, 그리고 박스 할당. 표 구조 인식 알고리즘은 강력한 이미지 텍스트 인식 알고리즘인 MASTER [1]를 기반으로 맞춤화되었습니다. PSENet [2]는 표 이미지에서 각 텍스트 줄을 검출하는 데 사용됩니다. 텍스트 줄 인식에 대해서는 우리의 모델도 MASTER를 기반으로 구성되었습니다. 마지막으로, 박스 할당 단계에서는 PSENet으로 검출된 텍스트 박스를 표 구조 예측에 의해 재구성된 구조 항목과 연관시키고, 인식된 텍스트 줄의 내용을 해당 항목에 채워넣습니다. 제안된 방법은 개발 단계에서 9,115개 검증 샘플에 대해 96.84%의 TEDS 점수를 달성하였으며, 최종 평가 단계에서는 9,064개 샘플에 대해 96.32%의 TEDS 점수를 기록하였습니다.