Command Palette
Search for a command to run...
LAION-SG 대규모 고품질 이미지 이해 데이터 세트
LAION-SG는 저장대학교, 장난대학교, 베이징대학교, 알리바바 그룹, 앤트 그룹이 2024년에 구축한 대규모 고품질 이미지 이해 데이터 세트입니다.LAION-SG: 구조적 주석을 포함한 복잡한 이미지-텍스트 모델을 학습하기 위한 향상된 대규모 데이터 세트LAION-SG는 객체, 속성, 관계 주석이 포함된 540,000개의 장면 그래프-이미지 쌍을 포함하며, 이는 훈련, 검증, 테스트 세트로 구분됩니다. 데이터셋의 이미지는 LAION-Aesthetics V2(6.5+) 데이터셋에서 가져왔으며, 주석 처리 과정에서는 자동 주석 처리를 위해 GPT-4o를 사용합니다.
원래의 LAION-Aesthetics 데이터 세트와 비교했을 때, LAION-SG의 평균 주석 길이와 정확도가 향상되었습니다. 이 데이터 세트의 각 샘플에는 평균 6.39개의 객체가 포함되어 있으며, 객체 정보가 20%만큼 증가합니다. 추상 고유명사를 제외하면 이러한 장점은 216%로 증가합니다.
LAION-SG 데이터 세트는 이미지 설명 생성, 시각적 질의응답 시스템, 이미지 검색 작업을 포함하여 이미지와 텍스트의 다양한 크로스모달 연구 분야에 적합합니다. 이러한 모든 분야는 이미지 콘텐츠에 대한 심층적인 이해와 의미 분석에 의존합니다.
