HyperAI

بالمعدل الحالي، هل ستستولي الذكاء الاصطناعي على وظائف المصممين؟

منذ 7 أعوام
معلومة
Sparanoid
特色图像

أطلقت شركة جوجل مؤخرًا برنامج رسم ذكي يسمى Auto Draw. كما يوحي الاسم، يمكن للبرنامج الرسم تلقائيًا. يمكنك رسم رسم تخطيطي على البرنامج حسب رغبتك، ثم سيقوم البرنامج تلقائيًا بمطابقة الصور المشابهة لتختار منها. هذا هو برنامج الذكاء الاصطناعي الأساسي للغاية، وهو مشابه جدًا لوظيفة إدخال الكتابة اليدوية في الهاتف المحمول.

بالمعدل الحالي، هل ستستولي الذكاء الاصطناعي على وظائف المصممين؟

غش الرسم؟

وفي الوقت نفسه، قام علي إسلامي وعدد من العلماء الآخرين بتطوير برنامج رسم أكثر ذكاءً يتمتع بالتفكير الحيوي والقدرة على التعلم من تلقاء نفسه. ما يمكن لهذا البرنامج فعله: بعد توفير صورة، يمكنه رسم "نسخة". النقطة الأساسية هي عملية الرسم، أي أن البرنامج لديه القدرة على رسم الصور بدلاً من مجرد المسح الضوئي وإخراجها مثل الماسح الضوئي.

وفيما يلي أفكار العلماء في مجال البحث والتطوير:

إلهام:

اكتشفنا أن البشر يرون أكثر من مجرد سطح الأشياء. على سبيل المثال، عندما نرى مبنى، فإننا لا نندهش فقط من تعقيد التصميم، بل ونقدر أيضًا براعة البناء. إن القدرة على رؤية الجوهر من خلال الظواهر هي أحد الأسباب المهمة لكون الذكاء البشري متفوقًا على ذكاء الأنواع الأخرى. ولذلك، فإننا نأمل في صنع برنامج ذكي مثل البشر أو يحاكي التفكير البشري. على سبيل المثال، عند النظر إلى لوحة فنية، نأمل أن يتمكن البرنامج من "فهم" كيفية رسم الصورة، بدلاً من مجرد التمييز بين وحدات البكسل في الصورة.

التحضير: المعدات

لقد قمنا بتزويد البرنامج بنفس أدوات الرسم ووجدنا أنه يمكنه التمييز تلقائيًا بين الطرق المختلفة التي يتم بها إنشاء الأرقام والأشخاص والصور الشخصية. والأهم من ذلك، يتم تحقيق ذلك من خلال التعلم الذاتي دون أي تدريب على مجموعة البيانات. وهذا يتناقض بشكل صارخ مع البرامج الأخرى التي يجب أن تتعلم من مجموعة البيانات، وهو الأمر الذي قد يستغرق وقتا طويلا.

أفكار تصميم المهندس

الخطوة 1: أساسيات برمجيات التعلم التعزيزي العميق

لقد قمنا أولاً بتصميم برنامج تعليمي معزز عميق للتفاعل مع برنامج الرسم على الكمبيوتر: الرسم على جهاز لوحي رقمي باستخدام قلم إلكتروني وتغيير حجم الفرشاة والضغط واللون حسب الرغبة. ومع ذلك، نظرًا لعدم تدريبهم، فإن الضربات التي يرسمونها تكون عشوائية ولا يمكن رؤية الهيكل العام. ولحل هذه المشكلة، قررنا إنشاء آلية مكافأة وعقاب لتشجيع إنتاج صور أكثر قيمة.

الخطوة 2: ترقية الشبكة العصبية المميزة

لقد قمنا بعد ذلك بتصميم شبكة عصبية تسمى المميز لتحديد ما إذا كانت الصورة مرسومة بواسطة برنامج أو صورة حقيقية. إذا تم الحكم على الصورة المرسومة بواسطة البرنامج بأنها صورة حقيقية، فسيتم "مكافأة" البرنامج. في الواقع، فإن "مكافأة" البرنامج هي أنه تعلم كيفية خداع المميز. هذه الطريقة مشابهة للطريقة المستخدمة بواسطة الشبكة العصبية السابقة GANS (الشبكات التنافسية التوليدية)، ولكن الفرق هو أن GAN تخرج وحدات البكسل مباشرة، بينما تخرج شبكتنا الصور بعد تفاعل البرنامج مع بيئة الصورة الحقيقية.

الخطوة 3: التدريب على مجموعات بيانات MNIST وOMNIGLOT

في المجموعة الأولى من التجارب، تم تدريب البرنامج لتوليد صور لأرقام مماثلة لتلك الموجودة في مجموعة بيانات MNIST. من خلال محاولة إنشاء صور تخدع المميز، تعلم البرنامج التحكم في الفرشاة للتكيف مع نمط الأرقام المختلفة، وهو ما نسميه غالبًا تقنية البرمجة المرئية.

الخطوة 4: الانتشار إلى مجموعات البيانات الشخصية الحقيقية

نقوم أيضًا بتدريب البرنامج باستخدام صور محددة، ونطلب منه إنشاء صور "منسوخة"، ثم نترك للمميز تحديد ما إذا كانت الصورة "المنسوخة" قد تم إنشاؤها بواسطة البرنامج وما إذا كانت نسخة من الصورة الأصلية. كلما كان التمييز أصعب، كلما كانت "المكافأة" أكبر (كلما تعلم البرنامج أكثر). الأمر الحاسم هو أن البرنامج يخزن سلسلة من الحركات التي تتحكم في فرشاة الرسم المحاكاة. وهذا يعني أن ما تم تعلمه أثناء المحاكاة يمكن تطبيقه على بيئات مماثلة أخرى، مثل الذراع الروبوتية لمحاكاة شخص حقيقي. لقطات الشاشة للفيديو هي كما يلي:

بالمعدل الحالي، هل ستستولي الذكاء الاصطناعي على وظائف المصممين؟

الشيء الآخر هو أن الإطار يمكن توسيعه ليشمل مجموعات بيانات حقيقية. عند التدريب على رسم تعبيرات الوجه الخاصة بالمشاهير، يمكن للبرنامج التقاط السمات الرئيسية للوجه: الشكل، والنغمة، وتسريحة الشعر، تمامًا كما يرسم فنان الشارع صورة شخصية ببضع ضربات فقط.

بالمعدل الحالي، هل ستستولي الذكاء الاصطناعي على وظائف المصممين؟

إن معرفة ما هو شيء ما ولماذا هو موجود هي قدرة يمتلكها البشر بسهولة ويستخدمونها بشكل متكرر. في هذه الدراسة، نجحنا في تمكين البرنامج من "فهم" كيفية رسم اللوحة بعد رؤيتها.خلال هذه الفترة، تعلمت أيضًا تقنيات البرمجة البصرية وكيفية التعبير عن علاقات السبب والنتيجة بشكل موجز.

ورغم أن هذه مجرد دراسة صغيرة، فإن التقنيات اللاحقة من هذا النوع ضرورية لتمكين الذكاء الاصطناعي من امتلاك قدرات معرفية وتعميمية وتحليلية وتواصلية تشبه قدرات الإنسان. على الرغم من أنه من المستحيل استبدال المصممين على المدى القصير، بل ومن المستحيل أيضًا استبدال أي من "دلاء عائلة Adobe"، فمن غير الممكن إنكار أن ظهور برامج الرسم التلقائي قد سمح لنا بالفعل برؤية سيناريو تطبيق آخر مثير للاهتمام وواعد للذكاء الاصطناعي.