LAION 멀티모달 데이터 세트

LAION은 대규모 인공지능 오픈 네트워크(Large-scale Artificial Intelligence Open Network)의 약자로, 대규모 AI 오픈 네트워크입니다.
3개의 데이터 세트가 포함되어 있습니다:
- LAION-400M: 4억 개의 영어 이미지-텍스트 쌍을 포함하는 오픈 데이터 세트로, 한때 전 세계에서 공개적으로 접근 가능한 가장 큰 이미지-텍스트 데이터 세트였습니다.
- LAION-5B: 58억 5천만 개의 CLIP 필터링된 다국어 이미지-텍스트 쌍을 포함하고 있으며, LAION-400M보다 14배 더 큽니다.
- LAION-Aesthetics: LAION-5B의 여러 고화질 이미지 하위 집합으로 구성됩니다.