منذ 7 أشهر

الملخص

يستكشف هذا العمل توليد الصور المشروط باستخدام نموذج كثافة صور جديد يعتمد على هندسة PixelCNN. يمكن تكييف النموذج بأي متجه، بما في ذلك العلامات الوصفية أو الهاشتاغات، أو التضمينات المخفية التي تم إنشاؤها بواسطة شبكات أخرى. عند تكييفه بالعلامات الفئوية من قاعدة بيانات ImageNet، يكون النموذج قادرًا على توليد مشاهد متنوعة وواقعية تمثل حيوانات وأشياء ومعالم طبيعية وهياكل مختلفة. عند تكييفه بتضمين يتم إنتاجه بواسطة شبكة انتقالية معطاة صورة واحدة لوجه غير معروف، فإنه يولد مجموعة متنوعة من الصور الشخصية لنفس الشخص بتعبيرات وجه مختلفة ومواقف وأوضاع إضاءة متنوعة. نوضح أيضًا أن PixelCNN المشروط يمكن أن يعمل كمفكك قوي في ترميز الصور ذاتيًا. بالإضافة إلى ذلك، فإن الطبقات الانتقالية المُحكَمة في النموذج المقترح تحسن احتمالية اللوغاريتم لـ PixelCNN لتتوافق مع أداء PixelRNN الرائد على ImageNet، مع خفض كبير في التكلفة الحسابية.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار