HKR 手書きテキスト認識データセット

下载帮助
特色图像

Handwriting Kazakh and Russian の正式名である HKR は、オフライン手書きテキスト認識用のロシア語とカザフ語の表形式データ セットです (ロシア語の約 95%、カザフ語の 5%)。 1,400 を超える記入フォーム、63,000 の文、715,699 以上の文字、および 200 人の著者が含まれています。表は LATEX によって生成され、その内容は作成者によって手書きされます。データセットはキリル語で書かれており、33 個の同一の文字を共有しています。これらの文字に加えて、カザフ語のアルファベットには 9 個の追加の特定の文字が含まれています。

このデータセットの内容:

  • カザフ語とロシア語のキーワードの手書きサンプル/表 (地域、都市、村など)
  • キリル文字の手書きのロシア語とカザフ語のサンプル
  • ロシアの詩の手書きサンプル/フォーム