2ヶ月前
BN-HTRd: ドキュメントレベルのオフラインベンガル文字手書きテキスト認識(HTR)および行分割のためのベンチマークデータセット
Rahman, Md. Ataur ; Tabassum, Nazifa ; Paul, Mitu ; Pal, Riya ; Islam, Mohammad Khairul

要約
バングラ文字のオフライン手書きテキスト認識(HTR)用に、単語、行、および文書レベルのアノテーションを含む新しいデータセットを紹介します。BN-HTRdデータセットはBBCバングラニュースコーパスに基づいており、真実値テキストとして機能することを目的としています。これらのテキストはその後、人々が手書きで記入することでアノテーションを生成するために使用されました。当社のデータセットには、約150人の異なる筆者によって作成された788枚の手書きページの画像が含まれています。このデータセットは、エンドツーエンドの文書認識、単語検出、単語や行のセグメンテーションなど、様々な手書き分類タスクの基盤として採用することができます。また、教師なし手法によりバングラ文字の手書き文書画像を対応する行に分割するスキームも提案しています。当社の行セグメンテーション手法は異なる書字スタイルに関連する変動性に対応し、曲線的な複雑な手書きテキスト行を正確に分割します。一連の前処理と形態学的操作に加えて、ハフ変換による直線と円の両方を使用して異なる線形成分を区別しました。これらの成分を対応する行に配置するために、教師なしクラスタリング手法を採用しました。当社のセグメンテーション技術はFM指標(F値に類似)で平均成功率81.57%、平均精度(mAP)0.547となっています。