HyperAIHyperAI

Command Palette

Search for a command to run...

BN-HTRd: ドキュメントレベルのオフラインベンガル文字手書きテキスト認識(HTR)および行分割のためのベンチマークデータセット

Md. Ataur Rahman Nazifa Tabassum Mitu Paul Riya Pal Mohammad Khairul Islam

概要

バングラ文字のオフライン手書きテキスト認識(HTR)用に、単語、行、および文書レベルのアノテーションを含む新しいデータセットを紹介します。BN-HTRdデータセットはBBCバングラニュースコーパスに基づいており、真実値テキストとして機能することを目的としています。これらのテキストはその後、人々が手書きで記入することでアノテーションを生成するために使用されました。当社のデータセットには、約150人の異なる筆者によって作成された788枚の手書きページの画像が含まれています。このデータセットは、エンドツーエンドの文書認識、単語検出、単語や行のセグメンテーションなど、様々な手書き分類タスクの基盤として採用することができます。また、教師なし手法によりバングラ文字の手書き文書画像を対応する行に分割するスキームも提案しています。当社の行セグメンテーション手法は異なる書字スタイルに関連する変動性に対応し、曲線的な複雑な手書きテキスト行を正確に分割します。一連の前処理と形態学的操作に加えて、ハフ変換による直線と円の両方を使用して異なる線形成分を区別しました。これらの成分を対応する行に配置するために、教師なしクラスタリング手法を採用しました。当社のセグメンテーション技術はFM指標(F値に類似)で平均成功率81.57%、平均精度(mAP)0.547となっています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています