日付

2年前

サイズ

9.83 GB

公開URL

github.com

Paper URL

arxiv.org

ライセンス

CC BY-NC-SA 3.0

タグ

マシンビジョン

Muharaf データセットは、2024 年に Mehreen Saeed らによって作成された、手書きのアラビア語認識に焦点を当てた機械学習データセットです。ムハラフ: 筆記体認識用の手書きアラビア語データセットの写本」が NeurIPS 24 に受理されました。このデータセットには、アーカイブアラビア語の専門家によって転写された歴史的な手書きのページの 1.6k 以上の画像が含まれています。各ドキュメント画像には、そのテキスト行の空間ポリゴン座標と、基礎となるページ要素に関する情報が伴います。 Muharaf データセットは、アラビア語写本だけでなく結合テキストの認識についても、手書きテキスト認識 (HTR) 分野の技術進歩を促進するために構築されました。このデータセットには、個人的な手紙、日記、メモ、詩、教会の記録、法的通信など、多様な書き方と幅広い種類の文書が含まれています。研究論文の中で、著者らはデータ取得プロセス、データセットの顕著な特徴と統計について説明し、これらのデータを使用して畳み込みニューラルネットワークをトレーニングした結果の予備的なベースライン結果を提供します。 Muharaf データセットは 2 つの部分に分かれています。公開部分には 1,216 個の画像が含まれ、CC BY-NC-SA 4.0 ライセンスに基づいて配布されます。制限付き部分には 428 個の画像が含まれ、独自のライセンスに基づいて配布され、レバノン人カルロス・ユネス研究フェニックスセンターをダウンロードしてください。このデータは研究目的のみであり、再配布は許可されていません。さらに、Muharaf データセットは ScribeArabic 注釈ソフトウェアを使用して作成されており、ソフトウェアのマニュアルはユーザーがその仕組みを理解するのに役立ちます。データセット内の画像ファイルは、対応する注釈、転写、タグとともに、PAGE-XML ビューアを使用して表示できます。

Muharaf.torrent

シーディング 1ダウンロード中 0完了 168総ダウンロード数 312

Muharaf/
- README.md
  2.27 KB
- README.txt
  4.54 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

9.83 GB

公開URL

github.com

Paper URL

arxiv.org

ライセンス

CC BY-NC-SA 3.0

タグ

マシンビジョン

Muharaf.torrent

シーディング 1ダウンロード中 0完了 168総ダウンロード数 312

Muharaf/
- README.md
  2.27 KB
- README.txt
  4.54 KB

地上情報源による世界洪水イベントデータセット

3ヶ月前

THINGS-EEG EEGデータセット

4ヶ月前

RubricHub_v1 マルチドメイン生成タスクデータセット

4ヶ月前

X線密輸品検出データセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

THINGS-EEG EEGデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

THINGS-EEG EEGデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

THINGS-EEG EEGデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

X線密輸品検出データセット

関連データセット

地上情報源による世界洪水イベントデータセット

THINGS-EEG EEGデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

X線密輸品検出データセット

Command Palette

ムハラフ氏手書きのアラビア語データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

ムハラフ氏手書きのアラビア語データセット

関連データセット

地上情報源による世界洪水イベントデータセット

THINGS-EEG EEGデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

ムハラフ氏手書きのアラビア語データセット

関連データセット

地上情報源による世界洪水イベントデータセット

THINGS-EEG EEGデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

X線密輸品検出データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

THINGS-EEG EEGデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

X線密輸品検出データセット

関連データセット

地上情報源による世界洪水イベントデータセット

THINGS-EEG EEGデータセット

RubricHub_v1 マルチドメイン生成タスクデータセット

X線密輸品検出データセット