ShareGPT4V 大規模で高品質なグラフィックおよびテキスト データ セット

日期

7 个月前

大小

466.32 MB

机构

中国科学技術大学
上海人工知能研究所

发布地址

github.com

许可协议

CC BY-SA 4.0

特色图像

ShareGPT4V データセットは、多数の画像とテキストのペアで構成される高品質のデータセットであり、画像理解とテキスト生成におけるモデルの機能を向上させるために視覚言語モデル (VLM) をトレーニングするために使用されます。データセットには 120 万の画像とテキストのペアが含まれており、視覚的特徴と言語的特徴を効果的に調整し、指示に従うモデルの能力を強化し、ScienceQA、TextVQA、SBU などのより学術的なタスクを組み込んでいます。このデータセットの導入により、モデルは、マルチモーダル表現学習の重要な側面である画像とテキストの位置合わせ機能が大幅に向上しました。

このデータセットは、中国科学技術大学の上海人工知能研究所によって 2023 年にリリースされました。

ShareGPT4V.torrent

做种 1

下载中 0

已完成 28

总下载 83

  • ShareGPT4V/
    • README.md
      1.51 KB
    • README.txt
      3.03 KB
      • data/
        • ShareGPT4V.zip
          466.32 MB