التاريخ

منذ عام واحد

الترخيص

MIT

الوسوم

"تحويل النص إلى صورة - 2 مليون" هي مجموعة بيانات عالية الجودة لأزواج النصوص والصور، مصممة لضبط نماذج تحويل النص إلى صورة بدقة. غالبًا ما تعاني مجموعات البيانات العامة الحالية من قيود (مجموعات بيانات فهم الصور، ومجموعات البيانات المجمعة بشكل غير رسمي أو الخاصة بمهام محددة، وقيود الحجم). لمعالجة هذه المشكلات، قام الفريق بدمج مجموعات البيانات عالية الجودة الحالية وتحسينها باستخدام نماذج متقدمة لتحويل النص إلى صورة ونماذج التعليقات التوضيحية لإنشاء مجموعة بيانات "تحويل النص إلى صورة - 2 مليون". تحتوي مجموعة البيانات على حوالي 2 مليون عينة، مقسمة إلى مجموعتين فرعيتين أساسيتين: data_512_2M (2 مليون صورة بدقة 512×512 وتعليقات توضيحية) و data_1024_10K (10000 صورة بدقة عالية 1024×1024 وتعليقات توضيحية)، مما يوفر خيارات مرنة لتدريب النموذج مع متطلبات دقة مختلفة.

تكوين البيانات:

البيانات_512_2م:

مجموعة بيانات الضبط الدقيق LLaVA-next (حوالي 700000 عينة، يتم إعادة إنشاء النص بواسطة Qwen2-VL لتحسين الدقة)
مجموعة بيانات LLaVA المدربة مسبقًا (حوالي 500000 عينة، ويتم إنشاء الصور بواسطة نموذج Flux-dev، ويتم الاحتفاظ بأوصاف النصوص الأصلية)
مجموعة بيانات ProGamerGov الاصطناعية (حوالي 900 ألف عينة، مقصوصة من المنتصف ومُفلترة الصلاحية)
مجموعة بيانات تم إنشاؤها بواسطة GPT-4o (100000 عينة، نص مصمم بواسطة GPT-4o، صور تم إنشاؤها بواسطة Flux-dev)

البيانات_1024_10 كيلو بايت:

يحتوي على 10000 صورة عالية الدقة، مع نص تم إنشاؤه بواسطة GPT-4o وصور تم تقديمها بواسطة نموذج Flux-dev، مع التركيز على المشاهد المعقدة ذات التفاصيل الغنية

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

ناقش على Discord

التاريخ

منذ عام واحد

الترخيص

MIT

الوسوم

تصنيف الصور

تكوين البيانات:

البيانات_512_2م:

مجموعة بيانات الضبط الدقيق LLaVA-next (حوالي 700000 عينة، يتم إعادة إنشاء النص بواسطة Qwen2-VL لتحسين الدقة)
مجموعة بيانات LLaVA المدربة مسبقًا (حوالي 500000 عينة، ويتم إنشاء الصور بواسطة نموذج Flux-dev، ويتم الاحتفاظ بأوصاف النصوص الأصلية)
مجموعة بيانات ProGamerGov الاصطناعية (حوالي 900 ألف عينة، مقصوصة من المنتصف ومُفلترة الصلاحية)
مجموعة بيانات تم إنشاؤها بواسطة GPT-4o (100000 عينة، نص مصمم بواسطة GPT-4o، صور تم إنشاؤها بواسطة Flux-dev)

البيانات_1024_10 كيلو بايت:

يحتوي على 10000 صورة عالية الدقة، مع نص تم إنشاؤه بواسطة GPT-4o وصور تم تقديمها بواسطة نموذج Flux-dev، مع التركيز على المشاهد المعقدة ذات التفاصيل الغنية

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

منذ 2 أشهر

مجموعة بيانات صور عرض الشوارع الوطنية من جوجل ستريت فيو

منذ 5 أشهر

مجموعة بيانات لعبة السيارات التي تحتوي على إيماءات اليد

منذ 5 أشهر

مجموعة بيانات تعابير الوجه البشري

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات تدريب تحويل النص إلى صورة - 2 مليون

تكوين البيانات:

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات تدريب تحويل النص إلى صورة - 2 مليون

تكوين البيانات:

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات صور عرض الشوارع الوطنية من جوجل ستريت فيو

مجموعة بيانات لعبة السيارات التي تحتوي على إيماءات اليد

مجموعة بيانات تعابير الوجه البشري

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات تدريب تحويل النص إلى صورة - 2 مليون

تكوين البيانات:

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات صور عرض الشوارع الوطنية من جوجل ستريت فيو

مجموعة بيانات لعبة السيارات التي تحتوي على إيماءات اليد

مجموعة بيانات تعابير الوجه البشري

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات صور عرض الشوارع الوطنية من جوجل ستريت فيو

مجموعة بيانات لعبة السيارات التي تحتوي على إيماءات اليد

مجموعة بيانات تعابير الوجه البشري

مجموعات البيانات ذات الصلة

مجموعة بيانات DRACO المعيارية للبحوث المعمقة متعددة المجالات

مجموعة بيانات صور عرض الشوارع الوطنية من جوجل ستريت فيو

مجموعة بيانات لعبة السيارات التي تحتوي على إيماءات اليد

مجموعة بيانات تعابير الوجه البشري