HyperAI

Discordで議論

日付

4年前

データセット構成

公開URL

github.com

Paper URL

arxiv.org

ライセンス

Other

タグ

画像説明

CC12M (Conceptual 12M) は、視覚および言語の事前トレーニング用に設計された画像とテキストのペアのデータセットです。データセットには 1,200 万の画像とテキストのペアが含まれています。 CC3M と比較して、このデータセットは複数の下流タスクのロングテール視覚認識で優れたパフォーマンスを発揮します。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。