HyperAIHyperAI

Command Palette

Search for a command to run...

MDPBench 多言語文書解析ベンチマークデータセット

日付

6時間前

Paper URL

2603.28130

ライセンス

Apache 2.0

MDPBenchは、多言語のデジタル文書や写真文書を解析するためのベンチマークデータセットです。関連する研究論文には、以下のようなものがあります。 MDPBench:実世界のシナリオにおける多言語文書解析のベンチマーク目的は、現実世界の複雑なシナリオにおいて、多言語文書を解析するモデルの能力を評価し、向上させることである。 このデータセットには、簡体字中国語、繁体字中国語、英語、アラビア語、ドイツ語、スペイン語、フランス語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、タイ語、ベトナム語を含む17言語の文書画像3,400枚が含まれています。これらの画像は、専門家によるモデル注釈、手動修正、手動検証という厳密なプロセスを経て、高品質な注釈が付与されています。

データセットの例
データセットの例

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています