مجموعة بيانات الصور والنصوص واسعة النطاق PD12M
التاريخ
الحجم
رابط النشر
العلامات
Public Domain 12M (PD12M باختصار) عبارة عن مجموعة بيانات نصية وصورية واسعة النطاق تم إنشاؤها بواسطة Spawning في عام 2024. تحتوي على 12.4 مليون صورة عالية الجودة مرخصة بموجب المجال العام وCC0 مع تعليقات توضيحية اصطناعية، والتي تُستخدم بشكل أساسي لتدريب نماذج تحويل النص إلى صورة. PD12M هي حاليًا أكبر مجموعة بيانات نصية للصور في المجال العام. بفضل حجمها الضخم وبيانات حقوق النشر الواضحة، فإنها توفر أساسًا قويًا لتدريب نماذج الذكاء الاصطناعي مع تقليل المخاوف المتعلقة بحقوق النشر. نتائج الورقة ذات الصلة هيالمجال العام 12 مليونًا: مجموعة بيانات نصية وصورية عالية الجودة مع آليات حوكمة جديدة".
تشمل مصادر بيانات PD12M المعارض والمكتبات والمحفوظات والمتاحف (GLAM) وWikimedia Commons، ويتم ضمان جودة البيانات وأمانها من خلال الفحص والحوكمة الدقيقة. تشمل عملية إنشاء مجموعة البيانات خطوات متعددة من جمع الصور والتحقق من حقوق النشر وتنزيل الصور وتصفية المحتوى إلى إنشاء التسمية التوضيحية. كما قدمت PD12M آلية حوكمة البيانات التي يقودها المجتمع من خلال منصة Source.Plus لدعم التحسين المستمر وصيانة مجموعة البيانات.
بالإضافة إلى ذلك، يتمتع PD12M بمجموعة واسعة من التطبيقات، ويستخدم بشكل أساسي لتدريب وتقييم نماذج توليد النص إلى صورة، بهدف تعزيز تطوير الرؤية الحاسوبية ومعالجة اللغة الطبيعية. لا توفر مجموعة البيانات هذه موارد تدريبية غنية لمجال الذكاء الاصطناعي فحسب، بل إنها تقدم أيضًا مثالًا لممارسات الذكاء الاصطناعي المسؤولة وتعزز حماية موارد الذكاء الاصطناعي العامة والاستفادة منها.
