11일 전

바ング알라 손글씨 그래페�에 대한 제로샷 분류를 가능하게 하는 파이프라인

{Tashin Ahmed, Md Habibur Sifat, Linsheng Guo}
바ング알라 손글씨 그래페�에 대한 제로샷 분류를 가능하게 하는 파이프라인
초록

이 연구는 제로샷 학습(Zero-Shot Learning, ZSL)을 탐구하며, 레이블과 그래프엠 사이의 강력한 연관성을 구축하기 위해 CycleGAN 기반의 이미지 합성과 정밀한 레이블 매핑 기법을 제안한다. 본 연구의 목적은 고급 폰트 이미지 분류 기술과 CycleGAN 기반 생성기(generator)를 활용하여 미관측 클래스의 탐지 정확도를 향상시키는 것이다. 추출된 추상적 문자 구조 표현은 관측된 클래스뿐 아니라 미관측 클래스까지도 효과적으로 수용하며, 인식 성능에 있어 상당한 향상을 보여준다. 본 연구는 방글라어 언어라는 특수한 맥락에서 광학 문자 인식(OCR)의 복잡한 문제를 다루고 있다. 방글라어 문자는 총 49개의 문자로 구성되어 있으며, 이는 11개의 모음, 38개의 자음, 18개의 부호(디아크리틱)를 포함하고 있다. 이러한 복잡한 문자 조합은 약 13,000개에 이르는 고유한 그래프엠 변형을 생성할 수 있으며, 이는 영어 언어에서 발견되는 그래픽 유닛 수를 훨씬 초과한다. 본 연구는 방글라어 OCR 환경에서 ZSL을 위한 새로운 전략을 제시한다. 이 전략은 생성 모델과 정교한 레이블링 기법을 결합하여 방글라어 OCR의 발전, 특히 그래프엠 분류 측면에서의 성과를 향상시키는 데 초점을 맞추고 있다. 궁극적으로 본 연구는 인도 대륙 지역의 교육 자료 디지털화에 실질적인 기여를 하는 것을 목표로 한다.

바ング알라 손글씨 그래페�에 대한 제로샷 분류를 가능하게 하는 파이프라인 | 최신 연구 논문 | HyperAI초신경