2달 전

BN-HTRd: 문서 수준 오프라인 벵갈어 필기체 텍스트 인식(HTR) 및 줄 세그멘테이션을 위한 벤치마크 데이터셋

Rahman, Md. Ataur ; Tabassum, Nazifa ; Paul, Mitu ; Pal, Riya ; Islam, Mohammad Khairul
BN-HTRd: 문서 수준 오프라인 벵갈어 필기체 텍스트 인식(HTR) 및 줄 세그멘테이션을 위한 벤치마크 데이터셋
초록

방글라 스크립트의 단어, 줄, 문서 수준 주석을 포함하는 오프라인 손글씨 인식(HTR)을 위한 새로운 데이터셋을 소개합니다. BN-HTRd 데이터셋은 BBC 방글라 뉴스 코퍼스를 기반으로 하며, 이는 사실상의 텍스트로 사용하도록 설계되었습니다. 이러한 텍스트는 이후에 사람들이 자신의 필기체로 작성한 주석을 생성하는 데 사용되었습니다. 우리의 데이터셋은 약 150명의 다른 필기체 작가들이 작성한 788장의 손글씨 페이지 이미지를 포함하고 있습니다. 이 데이터셋은 엔드투엔드 문서 인식, 단어 검색, 단어 또는 줄 분할 등의 다양한 손글씨 분류 작업의 기초 자료로 활용될 수 있습니다.또한 우리는 비지도 방식으로 방글라 스크립트의 손글씨 문서 이미지를 해당 줄로 분할하기 위한 방안을 제안합니다. 우리의 줄 분할 접근법은 다양한 필기체 스타일에 따른 변동성을 고려하여, 곡선 형태의 복잡한 손글씨 줄을 정확히 분할합니다. 사전 처리 및 형태학적 연산과 함께, 호프 선 및 원 변환을 사용하여 서로 다른 선형 구성 요소를 구분하였습니다. 이러한 구성 요소들을 해당 줄로 배치하기 위해 비지도 클러스터링 접근법을 따랐습니다. 우리의 분할 기술은 FM 메트릭(유사 F-측정)으로 평균 성공률이 81.57%, 평균 정밀도(mAP)가 0.547입니다.

BN-HTRd: 문서 수준 오프라인 벵갈어 필기체 텍스트 인식(HTR) 및 줄 세그멘테이션을 위한 벤치마크 데이터셋 | 최신 연구 논문 | HyperAI초신경