HyperAI

ShareGPT4V Ensemble De Données D'images Et De Textes De Haute Qualité À Grande Échelle

Date

il y a un an

Taille

466.32 MB

Organisation

Université des sciences et technologies de Chine
Laboratoire d'intelligence artificielle de Shanghai

URL de publication

github.com

Licence

CC BY-SA 4.0

特色图像

L'ensemble de données ShareGPT4V est un ensemble de données de haute qualité composé d'un grand nombre de paires image-texte. Il est utilisé pour former un modèle de langage visuel (VLM) afin d'améliorer les capacités du modèle en matière de compréhension d'images et de génération de texte. L'ensemble de données contient 1,2 million de paires image-texte qui alignent efficacement les caractéristiques visuelles et linguistiques, améliorent la capacité du modèle à suivre les instructions et intègrent davantage de tâches académiques telles que ScienceQA, TextVQA, SBU, etc. En introduisant cet ensemble de données, le modèle obtient une amélioration significative de la capacité d'alignement image-texte, qui est un aspect clé pour l'apprentissage de la représentation multimodale.

Cet ensemble de données a été publié par l'Université des sciences et technologies de Chine, Laboratoire d'intelligence artificielle de Shanghai en 2023.

ShareGPT4V.torrent
Partage 1Téléchargement 1Terminés 89Téléchargements totaux 121
  • ShareGPT4V/
    • README.md
      1.51 KB
    • README.txt
      3.03 KB
      • data/
        • ShareGPT4V.zip
          466.32 MB