HyperAIHyperAI

Command Palette

Search for a command to run...

استخلاص البيانات لتوليد الصور من النصوص على مجموعات بيانات صغيرة

Senmao Ye Fei Liu

الملخص

يتطلب إنشاء الصور من النص كمية كبيرة من البيانات التدريبية لتصنيع صور عالية الجودة. ولتعزيز بيانات التدريب، تعتمد الطرق السابقة على عمليات تداخل البيانات مثل التقليم، والانعكاس، والخلط، والتي تفشل في إدخال معلومات جديدة وتحصل على تحسينات طفيفة فقط. في هذه الورقة، نقترح طريقة جديدة لتعزيز البيانات لإنجاز إنشاء الصور من النص باستخدام الاستقراء الخطي. بشكل خاص، نطبق الاستقراء الخطي فقط على الميزات النصية، بينما تُسترجع بيانات الصور الجديدة من الإنترنت باستخدام محركات البحث. ولضمان موثوقية أزواج النص-الصورة الجديدة، قمنا بتصميم كاشفين للكشف عن القيم الشاذة لتنقية الصور المسترجعة. وباستخدام الاستقراء، نُنشئ عينات تدريبية تفوق حجم المجموعة الأصلية بعشرات المرات، مما يؤدي إلى تحسن كبير في أداء إنشاء الصور من النص. علاوةً على ذلك، نقترح دليلًا يُسمى NULL لتحسين تقدير الدرجات، ونطبق تحويلًا تآلفيًا متكررًا لدمج معلومات النص. تحقق نموذجنا من أداء متميز بمقاييس FID تبلغ 7.91 و9.52 و5.00 على مجموعات البيانات CUB وOxford وCOCO على التوالي. وسيكون الكود والبيانات متاحين على GitHub (https://github.com/senmaoy/RAT-Diffusion).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp