CapsFusion-120M 멀티모달 이미지 및 텍스트 데이터 세트

이 데이터 세트는 2024년 청화대학교와 BAAI가 출시한 다중 모달 이미지 및 텍스트 데이터 세트입니다. 논문 결과 "CapsFusion: 대규모 이미지-텍스트 데이터 재고"이는 CVPR 2024에 승인되었습니다.
이 데이터 세트는 대규모 멀티모달 사전 학습에 사용할 수 있는 고품질 리소스입니다. 이번 릴리스에는 LAION-2B 및 LAION-COCO 데이터 세트의 해당 캡션이 포함되어 있어 이미지-텍스트 데이터의 품질에 대한 비교 분석 및 심층 연구가 용이해집니다.
각 데이터 항목에는 4개의 필드가 있습니다.
- 이미지 URL
- LAION-2B 제목(웹에서 가져온 원본 대체 텍스트)
- LAION-COCO 자막(BLIP에서 합성)
- CapsFusion 제목(연구팀)
CapsFusion-120M.torrent
시딩 1다운로드 중 1완료됨 79총 다운로드 횟수 148