Command Palette
Search for a command to run...
مجموعة بيانات توليد الصور الاصطناعية Echo-4o-Image
التاريخ
الحجم
رابط الورقة البحثية
الترخيص
MIT
إيكو-4o-إيمج هي مجموعة بيانات صور تركيبية، أصدرها مختبر الذكاء الاصطناعي في شنغهاي عام ٢٠٢٥، بالتعاون مع جامعة صن يات صن، ومختبر الوسائط المتعددة (MMLab) التابع لجامعة هونغ كونغ الصينية، ومؤسسات أخرى. نتائج البحث ذات الصلة هي:Echo-4o: تسخير قوة صور GPT-4o الاصطناعية لتحسين توليد الصور"، والذي يهدف إلى تحسين قدرة نموذج المصدر المفتوح على إنشاء نص من الصور.
تم إنشاء مجموعة البيانات هذه بواسطة GPT-4o وتحتوي على ما يقرب من 179000 عينة، تغطي ثلاثة أنواع مختلفة من المهام:
- تنفيذ التعليمات المعقدة (حوالي 68000)، وتعزيز الامتثال للنصوص الطويلة/المفصلة؛
- جيل الخيال السريالي (حوالي 38000)، والذي يركز على المحتوى الخيالي؛
- إنشاء صور متعددة المراجع (حوالي 73000)، مناسبة للمشاهد التي تتطلب إشارات بصرية متعددة.
كل عينة عبارة عن شبكة صور 2×2 بدقة 1024×1024، تحتوي على مسار الصورة والميزات (السمات/الموضوعات) والمعلومات المنظمة للموجه الناتج.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.