مجموعة بيانات LAION متعددة الوسائط
التاريخ
منذ 2 أعوام
رابط النشر
الترخيص
CC BY 4.0

LAION تعني شبكة الذكاء الاصطناعي المفتوحة واسعة النطاق، وهي شبكة مفتوحة للذكاء الاصطناعي واسعة النطاق.
يتضمن 3 مجموعات بيانات:
- LAION-400M: مجموعة بيانات مفتوحة تحتوي على 400 مليون زوج من الصور والنصوص باللغة الإنجليزية، والتي كانت في السابق أكبر مجموعة بيانات صور ونصوص متاحة للعامة في العالم؛
- LAION-5B: يتضمن 5.85 مليار زوج من الصور والنصوص متعددة اللغات التي تمت تصفيتها باستخدام CLIP، وهو أكبر بـ 14 مرة من LAION-400M؛
- LAION-Aesthetics: يتكون من عدة مجموعات فرعية من الصور عالية الدقة من LAION-5B.