Command Palette

Search for a command to run...

ShareGPT4V 대규모 고품질 이미지 및 텍스트 데이터 세트

날짜

일 년 전

크기

466.32 MB

기관

중국 과학기술대학교
상하이 인공 지능 연구소

발행 주소

github.com

논문 URL

arxiv.org

라이선스

CC BY-SA 4.0

Featured Image

ShareGPT4V 데이터 세트는 다수의 이미지-텍스트 쌍으로 구성된 고품질 데이터 세트입니다. 이는 이미지 이해 및 텍스트 생성에 대한 모델의 역량을 개선하기 위해 시각 언어 모델(VLM)을 훈련하는 데 사용됩니다. 이 데이터 세트에는 시각적 및 언어적 특징을 효과적으로 정렬하고, 모델의 지시 사항 준수 능력을 향상시키며, ScienceQA, TextVQA, SBU 등과 같은 더 많은 학술적 작업을 통합하는 120만 개의 이미지-텍스트 쌍이 포함되어 있습니다. 이 데이터 세트를 도입함으로써 모델은 다중 모달 표현 학습의 핵심 측면인 이미지-텍스트 정렬 기능을 크게 개선했습니다.

이 데이터 세트는 2023년 중국과학기술대학 상하이 인공지능 연구실에서 공개되었습니다.

ShareGPT4V.torrent
시딩 1다운로드 중 0완료됨 151총 다운로드 횟수 245
  • ShareGPT4V/
    • README.md
      1.51 KB
    • README.txt
      3.03 KB
      • data/
        • ShareGPT4V.zip
          466.32 MB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp