日期
机构
发布地址
github.com
许可协议
其他
标签
画像の説明
分类
画像処理
CC12M (Conceptual 12M) は、視覚および言語の事前トレーニング用に設計された画像とテキストのペアのデータセットです。データセットには 1,200 万の画像とテキストのペアが含まれています。 CC3M と比較して、このデータセットは複数の下流タスクのロングテール視覚認識で優れたパフォーマンスを発揮します。