بعد النظر إلى 50000 غلاف ألبوم، ينتج مصمم الذكاء الاصطناعي صورًا مجنونة

استخدم الفنان الإسباني StyleGAN2 لإنشاء مصمم ذكاء اصطناعي، قام بتعليم نفسه بمساعدة 50 ألف صورة. لم يكن يتوقع أن تدريب مصمم انطباعي سيكون بهذه السهولة.
ربما تكون بعض التصاميم كلاسيكية ومتميزة لدرجة أن الناس لا يستطيعون إلا تقليدها.
في اليوم السابق لأمس، أصدرت منغ جيا، التي ظهرت للعلن بأغنية "Riding the Wind and Waves"، أغنية جديدة، واتُّهم غلاف الألبوم بسرقة أغنية أحد المشاهير على Instagram تمامًا؛
وبعد فترة وجيزة، تم الإشارة أيضًا إلى أن تصميم الممثلة سونغ زوير قد نسخ غلاف الألبوم الخاص بنجمة كورية على مستوى البكسل، وحتى العلامة المائية الأصلية لم تتم إزالتها. ومن الواضح أن الإبداع في التصميم ليس بالأمر السهل على الإطلاق.

من المؤكد أن الأشخاص الذين يشاركون في العمل الإبداعي سيفقدون الإلهام.الإشارة إلى أعمال الآخرين أو الاقتباس منها أو تقليدها، عن قصد أو بغير قصد. "هل يمكن اعتبار ذلك سرقة إذا كان عمل فنان؟"
حسنًا، في مواجهة إدانة مستخدمي الإنترنت، لم يفقد النجم ماء وجهه فحسب، بل خسر المصمم سمعته أيضًا.
50 ألف غلاف ألبوم، مصمم الذكاء الاصطناعي علم نفسه بنفسه
على الرغم من أن كلاهما عبارة عن إبداعات ثانوية بعد النسخ، إلا أن الذكاء الاصطناعي مع سمات الأدوات يبدو أكثر مبررًا.
الفنان العبقري الإسباني برونو لوبيز، استنادًا إلى 50,000 غلاف ألبوم على Spotify مكنت StyleGAN2 من NVIDIA من التعلم ذاتيًا. "تطورت" إلى "مصمم أغلفة ألبوم تجريدية خالية من المشاعر".

قام StyleGAN2 بسرعة بتشكيل مجموعته الخاصة من مواصفات التصميم وأنواع الأنماط من 50000 غلاف ألبوم Spotify.
يتكون غلاف الألبوم الحقيقي بشكل أساسي من جزأين.النص والعناصر المرئية الرئيسية.
إن عملية تدريب الذكاء الاصطناعي تشبه الطريقة التي يبحث بها البشر عن الأنماط في الصور. في تخطيط غلاف الألبوم،ويبدو أيضًا أن الذكاء الاصطناعي لديه خبرة جيدة في معايير نسبة الحجم مثل النسبة الذهبية، ومتتالية فيبوناتشي، وقاعدة الأثلاث.
ومع ذلك، فإن النمط العام لأغلفة الألبومات التي تم إنشاؤها بواسطة الذكاء الاصطناعي هو "غريب" بعض الشيء، ويمكن وصف بعض الأغلفة بأنها "فظيعة": وجه بشري بشع، وعين مفقودة من مقلة العين، وخلفية غير واضحة ما إذا كانت أمواجًا أو جثث حيوانات... ناهيك عن النص الضبابي والنغمات القاتمة.

بالإضافة إلى التأثر بأسلوب عينات التدريب، فإن مظهر هذه القطع الأثرية مرتبط أيضًا بالنموذج نفسه. لأن هذه البيانات التدريبية البالغ عددها 50 ألفًا تأتي جميعها من قائمة التوصيات التحريرية الخاصة بـ Spotify.لا يوجد قيود على أسلوب الفن الموسيقي، مما يؤدي إلى عدم كفاية بيانات التدريب لأسلوب واحد وظهور آثار وبقع شديدة.

StyleGAN هو عبارة عن بنية شبكة مولدة جديدة أصدرتها شركة NVIDIA. ويعتمد هذا النموذج على تكنولوجيا نقل الأسلوب ذات الصلة، والتي يمكنها تعديل السمات الرئيسية للكائن المستهدف طبقة بعد طبقة.
بسبب وجود تطبيع المثيل في AdaIN، سيتم فقدان بعض المعلومات الرئيسية للمدخلات أثناء عملية نقل النمط، مما يؤدي إلى وجود بقع وتحف في الصور المولدة.
StyleGAN2 هو إصدار مطور من StyleGAN، والذي يعمل على تحسين جودة الصور المولدة، ويقلل بشكل كبير من ظهور آثار الميزات، وهو أكثر تطوراً في معالجة التفاصيل.
استخدم الذكاء الاصطناعي لرسم الغلاف وإنشاء فيديو موسيقي
لتدريب مصمم الذكاء الاصطناعي الناضج، تعد بيانات التدريب والنماذج المدربة مسبقًا أمرًا ضروريًا. قدم برونو لوبيز عملية ميلاد "AI Designer" وصنع MV تجريديًا (فيديو موسيقي) باستخدام هذه الأغلفة.
إنشاء مجموعة بيانات:
1.تم العثور على واجهة برمجة التطبيقات المقابلة في Spotify، والتي يمكنها إرجاع بيانات تعريفية متعددة، بما في ذلك غلاف الألبوم، مع الأخذ في الاعتبار معرف الألبوم.
2.اكتب نصًا برمجيًا لزحف مكتبة الألبوم في قائمة توصيات محرر Spotify وتنزيل غلاف الألبوم.
3.احصل على مجموعة بيانات تحتوي على حوالي 50000 صورة ودقة 640×640.

عملية التدريب:
قام المؤلفون بالتدريب باستخدام تنفيذ skyflynil لـ StyleGAN2 الأصلي في Google Colab Pro. استغرقت العملية عدة أيام وتوقفت بعد 50 ألف دورة.
إن الاعتماد فقط على الذكاء الاصطناعي لإنشاء غلاف ألبوم بدائي ليس جيدًا بما فيه الكفاية في نظر الفنان العظيم برونو لوبيز.
لقد أعطاه مقطع الفيديو التوقيتي الذي انتشر على مواقع التواصل الاجتماعي ومضة من الإلهام.
اصنع فيديو نقطة البطاقة:
كتب المؤلف نصًا برمجيًا بلغة Python يعتمد على lhzbrian لإنشاء متجهات كامنة عشوائية، ثم قام باستيفاء هذه المتجهات لإنشاء انتقال متحرك تم إنشاؤه بواسطة الذكاء الاصطناعي.
من أجل مزامنة الرسوم المتحركة مع الأغنية، استخدم المؤلف بذكاء PyDub لمزامنة سرعة الاستيفاء مع حجم إيقاع كل إطار.
أخيرًا، باستخدام وحدة صورة Pillow وقدرات اكتشاف الوجوه في OpenCV، يمكن للبرنامج النصي إنشاء صور بميزات محددة (مثل غلاف الألبوم الأصفر بدون وجوه) باستخدام المتجه الكامن فقط.
كما أخذ برونو تجربة الجمهور في الاعتبار. في نهاية المطاف، مقطع فيديو مدته بضع ثوانٍ يترك لديك دائمًا شعورًا يدوم طويلًا. ولكي يصبح الفيلم النهائي أكثر متعة، جاء برونو بفكرة التبديلات والتركيبات.
قام أولاً بإنشاء مقاطع متعددة ذات خصائص مختلفة، ثم ضغطها في مقطع فيديو باستخدام Premiere.هذا هو الفيلم النهائي من سلسلة "Interference Music Video".
هل يهاجر الأسلوب، فهل يهاجر الإبداع أيضًا؟
في الفن أين الحدود بين الإبداع والتقليد؟
من حيث العملية الإبداعية، فإن الإبداع الفني يبدأ بالنسخ، نسخ الطبيعة ونسخ المجتمع. في عملية تعلم كيفية إنشاء أغلفة الألبومات، يقوم StyleGAN2 بإعادة إنتاج العملية بالكامل من نسخ الآخرين إلى تشكيل أسلوب شخصي.
يرى الرسام تشي بايشي أن جمال الفن يكمن في "التوازن بين التشابه والاختلاف". أسلوبه في الرسم جديد، وحيوي، وفريد من نوعه. في الواقع، بدأ السيد تشي أيضًا بنسخ لوحات الآخرين في سنواته الأولى.ومن خلال التقدير المستمر والنسخ والتفكير، وجدت تدريجيا أسلوبي الشخصي.

من ناحية أخرى، يقوم "الحمالون في صناعة التصميم" بالسرقة على مستوى البكسل، ويوقعون بأسمائهم الخاصة، بل ويستخدمونها حتى لتحقيق الربح التجاري. ومن حيث القدرات التجارية والأخلاقيات المهنية، فإن هؤلاء المبدعين ليسوا في الواقع على مستوى الذكاء الاصطناعي.
الرجوع إلى:https://arxiv.org/pdf/1912.04958.pdfhttps://thenextweb.com/neural/2021/03/08/ai-music-video-deep-learning-algorithm-stylegan2-album-covers-spotify-gans/https://docs.google.com/document/d/1qePvtKTJ3lbpxKfiJ1cn0wAVLazza0Zux4Lb-aTHuBE/edit?usp=sharing