HyperAI
Command Palette
Search for a command to run...
CC12M 画像とテキストのペア データセット

CC12M (Conceptual 12M) は、視覚および言語の事前トレーニング用に設計された画像とテキストのペアのデータセットです。データセットには 1,200 万の画像とテキストのペアが含まれています。 CC3M と比較して、このデータセットは複数の下流タスクのロングテール視覚認識で優れたパフォーマンスを発揮します。
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。