날짜

5년 전

조직

게시 URL

ai.google.com

Paper URL

www.aclweb.org

태그

객체 탐지

이 데이터 세트는 2018년에 구글에서 공개되었으며 330만 개의 이미지-캡션 쌍을 포함합니다. 이 팀은 수십억 개의 웹 페이지에서 후보 이미지와 텍스트 쌍을 추출, 필터링, 처리하는 자동화된 파이프라인을 만들었습니다. 데이터 세트는 훈련 세트, 검증 세트, 테스트 세트로 나뉩니다. 훈련 세트는 3,318,333개의 이미지 URL/제목 쌍으로 구성되어 있으며, 제목에 포함된 토큰 유형(즉, 어휘)의 총 수는 51,201개입니다. 각 제목에는 평균 10.3개의 토큰이 포함되어 있으며, 검증 세트는 15,840개의 이미지 URL/제목 쌍으로 구성됩니다. 또한, 연구팀은 훈련 세트에서 2,007,528개의 이미지 URL/제목 쌍에 대해 기계 생성 이미지 레이블을 제공했습니다. 관련 논문: 개념적 캡션: 자동 이미지 캡션을 위한 정제되고 상위어가 있는 이미지 대체 텍스트 데이터 세트

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.