Command Palette

Search for a command to run...

CapsFusion-120M 멀티모달 이미지 및 텍스트 데이터 세트

날짜

일 년 전

크기

23.21 GB

기관

칭화대학교

발행 주소

github.com

논문 URL

arxiv.org

Featured Image

이 데이터 세트는 2024년 청화대학교와 BAAI가 출시한 다중 모달 이미지 및 텍스트 데이터 세트입니다. 논문 결과 "CapsFusion: 대규모 이미지-텍스트 데이터 재고"이는 CVPR 2024에 승인되었습니다.

이 데이터 세트는 대규모 멀티모달 사전 학습에 사용할 수 있는 고품질 리소스입니다. 이번 릴리스에는 LAION-2B 및 LAION-COCO 데이터 세트의 해당 캡션이 포함되어 있어 이미지-텍스트 데이터의 품질에 대한 비교 분석 및 심층 연구가 용이해집니다.

각 데이터 항목에는 4개의 필드가 있습니다.

  • 이미지 URL
  • LAION-2B 제목(웹에서 가져온 원본 대체 텍스트)
  • LAION-COCO 자막(BLIP에서 합성)
  • CapsFusion 제목(연구팀)
CapsFusion-120M.torrent
시딩 2다운로드 중 0완료됨 154총 다운로드 횟수 293
  • CapsFusion-120M/
    • README.md
      1.34 KB
    • README.txt
      2.69 KB
      • data/
        • CapsFusion-120M.zip
          23.21 GB

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
CapsFusion-120M 멀티모달 이미지 및 텍스트 데이터 세트 | 데이터셋 | HyperAI초신경