12日前

SUT:ペルシャ語ドキュメント画像解析のための新しい多目的合成データセット

{Hossein Nezamabadi-pour, Ali Afkari Fahandari, Fatemeh sadat Eslami, Elham Shabaninia}
要約

本稿では、ペルシャ語文書画像のための新しい大規模データセット「SUT」を紹介する。このデータセットは、文書画像解析(DIA)タスク、特に文書画像分類、テキスト検出・認識、情報検索などにおける教師ありモデルの開発に向け、多様性と量を兼ね備えたグランドトゥースデータの取得という課題に取り組むことを目的としている。SUTデータセットは、21の異なるカテゴリに分類された合計62,453枚の画像を含んでおり、背景が異なる複数のパターンに合成された個人情報を重ね合わせた身分証明書類も含まれている。各画像に対応するラベル情報が含まれるファイルも併せて提供されており、グランドトゥースデータは、画像ファイルのパスと埋め込まれたデータに関する情報を統合したCSV形式のファイルに格納されている。SUTデータセットのDIAタスクにおける有効性を示すために、文書分類(畳み込みニューラルネットワークを用いて86%の精度を達成)およびOCR(TesseractとEasyOCRエンジンを用いてそれぞれCER 0.083および0.072を達成)の実験が実施された。本データセットは、ペルシャ語文書画像解析における教師ありモデルの開発と評価に向けた貴重なリソースとして、研究者にとって大きな価値を持つものである。

SUT:ペルシャ語ドキュメント画像解析のための新しい多目的合成データセット | 最新論文 | HyperAI超神経