11日前

バングラ語手書きグラフェムに対するゼロショット分類を可能にするパイプライン

{Tashin Ahmed, Md Habibur Sifat, Linsheng Guo}
バングラ語手書きグラフェムに対するゼロショット分類を可能にするパイプライン
要約

本研究は、ゼロショット学習(Zero-Shot Learning, ZSL)に焦点を当て、CycleGANを用いた画像生成技術と正確なラベルマッピングを活用して、ラベルとグラフェム(文字の構造単位)の間に強固な関連性を構築することを提案する。この研究の目的は、高度なフォント画像分類とCycleGANベースの生成器を用いることで、未観測クラスの検出精度を向上させることにある。抽象的な文字構造の表現が得られ、既視クラスと未視クラスの両方に高い認識性能を示すことが明らかになった。本研究は、バングラ語における光学文字認識(OCR)という複雑な課題に取り組むものである。バングラ文字は、合計49の文字から構成され、そのうち11の母音、38の子音、18の付加記号(ディアクリティック)を含む。この複雑な文字の組み合わせにより、約13,000種類もの独自のグラフェム変形が生じるが、これは英語におけるグラフェム単位の数をはるかに上回る。本研究は、バングラ語OCRにおけるZSLのための新しい戦略を提示する。このアプローチは、生成モデルと精密なラベル付け技術を統合することで、特にグラフェム分類に注力し、バングラ語OCRの進展を促進することを目的としている。最終的な目標は、インド亜大陸における教育資源のデジタル化に実質的な貢献をすることにある。

バングラ語手書きグラフェムに対するゼロショット分類を可能にするパイプライン | 最新論文 | HyperAI超神経