9日前

KOHTD:カザフ非オンライン手書きテキストデータセット

Nazgul Toiganbayeva, Mahmoud Kasem, Galymzhan Abdimanap, Kairat Bostanbekov, Abdelrahman Abdallah, Anel Alimova, Daniyar Nurseitov
KOHTD:カザフ非オンライン手書きテキストデータセット
要約

デジタル情報交換への移行が進む中でも、請求書、税務書類、メモ、アンケート票、歴史的データ、試験問題の回答など、依然として手書き入力が求められる文書は多く存在する。このような状況を踏まえ、コンピュータを用いて記録を自動的に解読する手書きテキスト認識(Handwritten Text Recognition, HTR)の導入が求められている。手書き認識は、同じメッセージを人によってほぼ無限に異なる方法で記述できるため、極めて困難な課題である。本研究では、カザフ語手書きテキスト認識に関する研究を提案し、そのために包括的なカザフ語手書きテキストデータセットの整備が不可欠である。特に、カザフ語手書きテキスト用のデータセットが現状存在しないことから、その必要性は一層高まっている。本論文では、3,000枚の手書き試験用紙と140,335枚以上のセグメント化画像、約922,010文字を含む、広範なカザフ語オフライン手書きテキストデータセット(Kazakh Offline Handwritten Text Dataset, KOHTD)を提案する。このデータセットは、深層学習および機械学習を活用した手書き認識研究を支援するための貴重な資源となる。本研究では、CTCベースおよびアテンションベースを含む、多数の代表的なテキスト認識手法を用いて単語および行の認識を実施した。その結果、KOHTDが多様性に富んでいることが示された。さらに、パラメータのランダムな組み合わせを用いたランダム探索に基づく遺伝的アルゴリズム(Genetic Algorithm, GA)を、行および単語のセグメンテーションに適用する手法を提案した。本データセットおよびGAの実装コードは、https://github.com/abdoelsayed2016/KOHTD にて公開されている。

KOHTD:カザフ非オンライン手書きテキストデータセット | 最新論文 | HyperAI超神経