2달 전

SUT: 페르시아어 문서 이미지 분석을 위한 새로운 다목적 합성 데이터셋

{Hossein Nezamabadi-pour, Ali Afkari Fahandari, Fatemeh sadat Eslami, Elham Shabaninia}

초록

이 논문은 페르시아어 문서 이미지 분석(DIA) 작업, 예를 들어 문서 이미지 분류, 텍스트 탐지 및 인식, 정보 검색 등에서 사용할 수 있도록 설계된 새로운 대규모 데이터셋인 SUT를 소개한다. SUT는 지도 학습 모델을 위한 다양한 및 풍부한 참값(ground-truth) 데이터 확보에 있어 직면한 과제를 해결하는 것을 목표로 한다. 이 데이터셋은 총 62,453개의 이미지로 구성되며, 다양한 배경에 합성된 개인 정보가 중첩된 신분증류 문서를 포함한 총 21개의 서로 다른 클래스로 분류된다. 또한 각 이미지에 대한 레이블 정보를 포함한 관련 파일도 함께 제공된다. 참값 데이터는 이미지 파일 경로와 내장된 데이터에 대한 정보를 통합하여 저장한 CSV 파일 형식으로 구성되어 있다. SUT 데이터셋이 DIA 작업에서 효과적임을 입증하기 위해, 문서 분류(컨볼루션 신경망을 사용해 정확도 86% 달성) 및 OCR(테세랙트와 이지오크 엔진을 각각 사용해 CER 0.083 및 0.072 달성)에 활용되었다. SUT 데이터셋은 페르시아어 문서 이미지 분석 분야에서 지도 학습 모델의 개발 및 평가를 목표로 하는 연구자들에게 귀중한 자원으로 기여할 수 있다.