7ヶ月前

データセット

畳み込みニューラルネットワーク

AIインフラストラクチャ

アプローチ／フレームワーク

コンピュータビジョン

Hossein Nezamabadi-pour Ali Afkari Fahandari Fatemeh sadat Eslami Elham Shabaninia

概要

本稿では、ペルシャ語文書画像のための新しい大規模データセット「SUT」を紹介する。このデータセットは、文書画像解析（DIA）タスク、特に文書画像分類、テキスト検出・認識、情報検索などにおける教師ありモデルの開発に向け、多様性と量を兼ね備えたグランドトゥースデータの取得という課題に取り組むことを目的としている。SUTデータセットは、21の異なるカテゴリに分類された合計62,453枚の画像を含んでおり、背景が異なる複数のパターンに合成された個人情報を重ね合わせた身分証明書類も含まれている。各画像に対応するラベル情報が含まれるファイルも併せて提供されており、グランドトゥースデータは、画像ファイルのパスと埋め込まれたデータに関する情報を統合したCSV形式のファイルに格納されている。SUTデータセットのDIAタスクにおける有効性を示すために、文書分類（畳み込みニューラルネットワークを用いて86％の精度を達成）およびOCR（TesseractとEasyOCRエンジンを用いてそれぞれCER 0.083および0.072を達成）の実験が実施された。本データセットは、ペルシャ語文書画像解析における教師ありモデルの開発と評価に向けた貴重なリソースとして、研究者にとって大きな価値を持つものである。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

データセット

畳み込みニューラルネットワーク

AIインフラストラクチャ

アプローチ／フレームワーク

コンピュータビジョン

Hossein Nezamabadi-pour Ali Afkari Fahandari Fatemeh sadat Eslami Elham Shabaninia

概要

本稿では、ペルシャ語文書画像のための新しい大規模データセット「SUT」を紹介する。このデータセットは、文書画像解析（DIA）タスク、特に文書画像分類、テキスト検出・認識、情報検索などにおける教師ありモデルの開発に向け、多様性と量を兼ね備えたグランドトゥースデータの取得という課題に取り組むことを目的としている。SUTデータセットは、21の異なるカテゴリに分類された合計62,453枚の画像を含んでおり、背景が異なる複数のパターンに合成された個人情報を重ね合わせた身分証明書類も含まれている。各画像に対応するラベル情報が含まれるファイルも併せて提供されており、グランドトゥースデータは、画像ファイルのパスと埋め込まれたデータに関する情報を統合したCSV形式のファイルに格納されている。SUTデータセットのDIAタスクにおける有効性を示すために、文書分類（畳み込みニューラルネットワークを用いて86％の精度を達成）およびOCR（TesseractとEasyOCRエンジンを用いてそれぞれCER 0.083および0.072を達成）の実験が実施された。本データセットは、ペルシャ語文書画像解析における教師ありモデルの開発と評価に向けた貴重なリソースとして、研究者にとって大きな価値を持つものである。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています