Command Palette
Search for a command to run...
ParseBench文書解析能力評価データセット
ParseBench文書解析能力評価データセットは、LlamaIndexチームによって2024年から2025年にかけて公開され、関連する論文結果は以下のとおりです。 ParseBench:AIエージェント向け文書解析ベンチマーク本研究は、文書解析を従来のOCRから構造化された理解へと進化させることを促進し、マルチモーダルモデルおよび情報抽出システムの評価と最適化を支援することを目的としている。 このデータセットには、約2,000の手動で検証およびラベル付けされたページと、5つの次元にわたる169,011のテストルールが含まれています。これらのページは、保険、金融、政府、その他の分野を網羅する公開されている企業文書から取得されており、PDF、スキャン画像、表やレイアウト構造を含むページなど、さまざまなページタイプが含まれています。標準化された解析結果が提供され、人間の注釈と整合させることで、構造理解と情報抽出におけるモデルのパフォーマンスを評価します。