Command Palette
Search for a command to run...
PhysToolBench 物理ツールタスクデータセット
PhysToolBenchは、香港科技大学(広州)が香港科技大学、北京航空航天大学などの研究機関と共同で2025年に公開した視覚言語質問応答(VQA)データセットです。関連する研究論文のタイトルは「…」です。PhysToolBench: MLLM 向け物理ツール理解のベンチマークこの研究の目的は、マルチモーダル大規模言語モデル (MLLM) が物理的なツールを識別、理解、作成する能力を評価することです。
このデータセットには、日常生活、産業、屋外活動、専門環境など、様々なシナリオを網羅した1,000以上の画像とテキストのペアが含まれています。難易度は「簡単」「中」「難しい」の3段階に分かれています。タスク構造は以下のとおりです。
- ツールの作成
- ツール認識
- ツールの理解
