HyperAIHyperAI

Command Palette

Search for a command to run...

バングラ語手書きグラフェムに対するゼロショット分類を可能にするパイプライン

Tashin Ahmed Md Habibur Sifat Linsheng Guo

概要

本研究は、ゼロショット学習(Zero-Shot Learning, ZSL)に焦点を当て、CycleGANを用いた画像生成技術と正確なラベルマッピングを活用して、ラベルとグラフェム(文字の構造単位)の間に強固な関連性を構築することを提案する。この研究の目的は、高度なフォント画像分類とCycleGANベースの生成器を用いることで、未観測クラスの検出精度を向上させることにある。抽象的な文字構造の表現が得られ、既視クラスと未視クラスの両方に高い認識性能を示すことが明らかになった。本研究は、バングラ語における光学文字認識(OCR)という複雑な課題に取り組むものである。バングラ文字は、合計49の文字から構成され、そのうち11の母音、38の子音、18の付加記号(ディアクリティック)を含む。この複雑な文字の組み合わせにより、約13,000種類もの独自のグラフェム変形が生じるが、これは英語におけるグラフェム単位の数をはるかに上回る。本研究は、バングラ語OCRにおけるZSLのための新しい戦略を提示する。このアプローチは、生成モデルと精密なラベル付け技術を統合することで、特にグラフェム分類に注力し、バングラ語OCRの進展を促進することを目的としている。最終的な目標は、インド亜大陸における教育資源のデジタル化に実質的な貢献をすることにある。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
バングラ語手書きグラフェムに対するゼロショット分類を可能にするパイプライン | 記事 | HyperAI超神経