WIT 이미지-텍스트 데이터 세트

날짜

3년 전

크기

25.2 GB

기관

발행 주소

github.com

라이선스

其他

태그

이미지 검색

텍스트 인식

카테고리

이미지 검색

데이터셋 다운로드 마그넷 링크 다운로드 도움말

WIT는 대규모 다중 모드 및 다국어 데이터 세트인 Wikipedia 기반 이미지 텍스트를 의미합니다. 이 데이터 세트는 108개 위키백과 언어로 작성된 1,150만 개의 고유한 이미지를 포함하는 3,760만 개의 엔터티가 강화된 이미지-텍스트 예시로 구성된 큐레이션된 컬렉션으로 구성되어 있습니다. 이 데이터 세트의 크기는 다중 모드 머신 러닝 모델의 사전 학습 데이터 세트로 사용하기에 적합합니다.

WIT에는 4가지 독특한 장점이 있습니다.

WIT는 이미지-텍스트 예시의 수 측면에서 가장 큰 멀티모달 데이터 세트입니다.
100개 이상의 언어가 포함되어 있으며(언어당 최소 12,000개의 예 포함), 많은 이미지에 대해 언어 간 텍스트가 제공됩니다.
이전 데이터 세트에 비해 WIT는 더 다양한 개념과 현실 세계의 실체를 나타냅니다.
WIT는 매우 도전적인 실제 테스트 세트를 제공합니다.

WIT.torrent

시딩 1다운로드 중 1완료됨 491총 다운로드 횟수 683

WIT/
- README.md
  1.41 KB
- README.txt
  2.82 KB