날짜
크기
기관
발행 주소
redcaps.xyz
라이선스
其他
카테고리
RedCaps는 Reddit의 총 120만 개의 데이터를 포함하는 대규모 이미지-텍스트 쌍 데이터 세트입니다. 그림과 글은 다양한 사물과 장면을 묘사하고 있습니다.
데이터는 인간이 큐레이팅한 일련의 서브레딧에서 수집되었으며, 이를 통해 대략적인 이미지 레이블을 제공하고 개별 인스턴스에 레이블을 지정하지 않고도 데이터 세트를 조립할 수 있었습니다.
미시간 대학의 팀이 데이터 세트를 공개했습니다.