Command Palette
Search for a command to run...
OmniParsingBench マルチモーダル構文解析機能評価データセット
OmniParsingBenchは、マルチモーダル大規模モデル(MLLM)の統合構文解析能力を評価するために、Alibabaが2026年に公開したベンチマークデータセットです。関連する研究論文には、以下のようなものがあります。 ロジック解析オムニ技術レポートこの手法は、従来の単一タスク評価の限界を打破し、知覚から認知に至るプロセス全体を通してモデルの能力を体系的に評価することを目的としており、マルチモーダル理解、構造化情報抽出、複雑な推論能力の研究などのシナリオで広く利用されている。 このデータセットには、6つのモダリティ(自然画像、グラフィック、文書、音声、自然動画、テキスト中心の動画)を網羅した約5,294個のサンプルが含まれており、知覚(Perc.)、認知(Cog.)、総合(Ovr.)の3つのレベルの評価指標が導入されています。各データセットには、画像または音声/動画の入力と、それに対応する構造化された解析タスクが含まれています。