LAION-SG 대규모 고품질 이미지 이해 데이터 세트
LAION-SG는 저장대학교, 장난대학교, 베이징대학교, 알리바바 그룹, 앤트 그룹이 2024년에 구축한 대규모 고품질 이미지 이해 데이터 세트입니다.LAION-SG: 구조적 주석을 포함한 복잡한 이미지-텍스트 모델을 학습하기 위한 향상된 대규모 데이터 세트LAION-SG는 객체, 속성, 관계 주석이 포함된 540,000개의 장면 그래프-이미지 쌍을 포함하며, 이는 훈련, 검증, 테스트 세트로 구분됩니다. 데이터셋의 이미지는 LAION-Aesthetics V2(6.5+) 데이터셋에서 가져왔으며, 주석 처리 과정에서는 자동 주석 처리를 위해 GPT-4o를 사용합니다.
원래의 LAION-Aesthetics 데이터 세트와 비교했을 때, LAION-SG의 평균 주석 길이와 정확도가 향상되었습니다. 이 데이터 세트의 각 샘플에는 평균 6.39개의 객체가 포함되어 있으며, 객체 정보가 20%만큼 증가합니다. 추상 고유명사를 제외하면 이러한 장점은 216%로 증가합니다.
LAION-SG 데이터 세트는 이미지 설명 생성, 시각적 질의응답 시스템, 이미지 검색 작업을 포함하여 이미지와 텍스트의 다양한 크로스모달 연구 분야에 적합합니다. 이러한 모든 분야는 이미지 콘텐츠에 대한 심층적인 이해와 의미 분석에 의존합니다.

LAION-SG.torrent
시딩 3다운로드 중 0완료됨 46총 다운로드 횟수 100