Mantis-Instruct マルチイメージ命令チューニング データセット

下载帮助

Mantis-Instruct データセットは、ウォータールー大学、清華大学、上海人工知能研究所によって 2024 年にリリースされたデータセットです。関連する論文結果は「MANTIS: インターリーブされたマルチイメージ命令のチューニング”。マルチイメージ命令のチューニングに焦点を当てた、テキストとイメージがインターリーブされたマルチモーダル データセット。721K のサンプルを含む 14 のサブセットで構成され、Mantis モデル ファミリのトレーニングに使用されます。このデータセットは、共参照、推論、比較、時間的理解を含む、さまざまなマルチ画像スキルをカバーします。既存のデータセットの 10 個のサブセットが含まれているだけでなく、モデルの推論スキルやその他のマルチ画像スキルを拡張するように設計された 4 つの新しく厳選されたデータセットも追加されています。