التاريخ

منذ 2 أعوام

الحجم

34.77 GB

المؤسسة

عنوان URL للنشر

source.plus

رابط الورقة البحثية

arxiv.org

الوسوم

تصنيف الصور

Public Domain 12M (PD12M باختصار) عبارة عن مجموعة بيانات نصية وصورية واسعة النطاق تم إنشاؤها بواسطة Spawning في عام 2024. تحتوي على 12.4 مليون صورة عالية الجودة مرخصة بموجب المجال العام وCC0 مع تعليقات توضيحية اصطناعية، والتي تُستخدم بشكل أساسي لتدريب نماذج تحويل النص إلى صورة. PD12M هي حاليًا أكبر مجموعة بيانات نصية للصور في المجال العام. بفضل حجمها الضخم وبيانات حقوق النشر الواضحة، فإنها توفر أساسًا قويًا لتدريب نماذج الذكاء الاصطناعي مع تقليل المخاوف المتعلقة بحقوق النشر. نتائج الورقة ذات الصلة هيالمجال العام 12 مليونًا: مجموعة بيانات نصية وصورية عالية الجودة مع آليات حوكمة جديدة". تشمل مصادر بيانات PD12M المعارض والمكتبات والمحفوظات والمتاحف (GLAM) وWikimedia Commons، ويتم ضمان جودة البيانات وأمانها من خلال الفحص والحوكمة الدقيقة. تشمل عملية إنشاء مجموعة البيانات خطوات متعددة من جمع الصور والتحقق من حقوق النشر وتنزيل الصور وتصفية المحتوى إلى إنشاء التسمية التوضيحية. كما قدمت PD12M آلية حوكمة البيانات التي يقودها المجتمع من خلال منصة Source.Plus لدعم التحسين المستمر وصيانة مجموعة البيانات. بالإضافة إلى ذلك، يتمتع PD12M بمجموعة واسعة من التطبيقات، ويستخدم بشكل أساسي لتدريب وتقييم نماذج توليد النص إلى صورة، بهدف تعزيز تطوير الرؤية الحاسوبية ومعالجة اللغة الطبيعية. لا توفر مجموعة البيانات هذه موارد تدريبية غنية لمجال الذكاء الاصطناعي فحسب، بل إنها تقدم أيضًا مثالًا لممارسات الذكاء الاصطناعي المسؤولة وتعزز حماية موارد الذكاء الاصطناعي العامة والاستفادة منها.

PD12M.torrent

البذر 1جارٍ التنزيل 0مكتمل 174إجمالي التنزيلات 267

PD12M/
- README.md
  2.02 KB
- README.txt
  4.05 KB

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار