Command Palette
Search for a command to run...
MDPBench 多言語文書解析ベンチマークデータセット
MDPBenchは、多言語のデジタル文書や写真文書を解析するためのベンチマークデータセットです。関連する研究論文には、以下のようなものがあります。 MDPBench:実世界のシナリオにおける多言語文書解析のベンチマーク目的は、現実世界の複雑なシナリオにおいて、多言語文書を解析するモデルの能力を評価し、向上させることである。 このデータセットには、簡体字中国語、繁体字中国語、英語、アラビア語、ドイツ語、スペイン語、フランス語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、タイ語、ベトナム語を含む17言語の文書画像3,400枚が含まれています。これらの画像は、専門家によるモデル注釈、手動修正、手動検証という厳密なプロセスを経て、高品質な注釈が付与されています。
