2달 전

Persis: 합성곱 신경망을 사용한 페르시아 글꼴 인식 파이프라인

Mohammadian, Mehrdad ; Maleki, Neda ; Olsson, Tobias ; Ahlgren, Fredrik
Persis: 합성곱 신경망을 사용한 페르시아 글꼴 인식 파이프라인
초록

디자인 작업에 적합한 폰트를 발견했지만 그 이름을 모르는 경우 어떻게 해야 할까요? 시각적 폰트 인식(VFR) 시스템은 이미지 내의 폰트 타입페이스를 식별하는 데 사용됩니다. 이러한 시스템은 그래픽 디자이너가 이미지에서 사용된 폰트를 식별하는 데 도움을 줄 수 있습니다. 또한 VFR 시스템은 광학 문자 인식(OCR) 시스템의 속도와 정확성을 향상시키는 역할을 합니다. 본 논문에서는 페르시아어 폰트 인식 분야에서 처음으로 공개된 데이터셋을 소개하고, 합성곱 신경망(CNN)을 활용하여 이 문제를 해결합니다. 결과는 제안된 파이프라인이 새로운 데이터셋에서 78.0%의 상위 1위 정확도를, IDPL-PFOD 데이터셋에서 89.1%의 상위 1위 정확도를, KAFD 데이터셋에서 94.5%의 상위 1위 정확도를 달성함을 보여줍니다. 또한 제안된 데이터셋의 하나의 샘플에 대한 전체 파이프라인에서 소요되는 평균 시간은 CPU에서는 0.54초, GPU에서는 0.017초입니다. 우리는 CNN 방법론이 특징 추출, 이진화, 정규화 등의 추가적인 사전 처리 단계 없이 페르시아어 폰트를 인식할 수 있음을 결론짓습니다.