HyperAI

التعلم العميق يدخل في مجال التجميل، هل يفقد المشاهير والمدونون على الإنترنت وظائفهم؟

特色图像

في السنوات الأخيرة، ظهر عدد متزايد من مدوني الجمال على الإنترنت. إنهم يشرحون نصائح التجميل ويشاركون نتائج التجارب التجميلية من أجل تجميع المعجبين والتعاون مع الشركات لبيع المنتجات.

على سبيل المثال، كان لي جيا تشي، الذي كان يتمتع بشعبية كبيرة منذ بعض الوقت، معروفًا باسم "شيطان أحمر الشفاه"مدونة الجمال. لقد حاول ذلك مرة واحدة في بث مباشر. 380 نوعًاتم بيع لون أحمر الشفاه خلال دقيقة واحدة. 14,000سجل أحمر الشفاه.

ومع ذلك، كان ينبغي على العديد من الفتيات اللواتي يعشقن المكياج أن يدركن منذ فترة طويلة أنه حتى لو اشترين نفس أحمر الشفاه الذي تشتريه المدونة، فإن التأثير سيكون مختلفًا. رأيت أن الألوان التي جربها لي جياكي والآخرون تبدو جميلة جدًا، تشبه الجنيات، وفاخرة، ولكن عندما وضعتها على شفتي، لماذا أصبحت بهذا اللون...

"معرض البائع" و"معرض المشتري" في صناعة أحمر الشفاه

هذا صحيح، وذلك لأن شكل وجه كل شخص، ولون بشرته، وشكل شفتيه، وما إلى ذلك، يختلف مما يؤدي إلى "معرض البائع" و"معرض المشتري"نتيجة.

السؤال الآن هو كيف يمكنك أن تعرف أي منتج تجميل هو الأنسب لك؟ أعطت شركة تدعى ميرا الإجابة:استخدم التعلم العميق.

التعلم العميق يحب الجمال أيضًا

يعتقد الكثير من الناس أن مصطلحات مثل الذكاء الاصطناعي والتعلم العميق لا علاقة لها بالجمال، لكن ميرا، وهي شركة ناشئة مقرها لوس أنجلوس، لا تعتقد ذلك.

قررت الشركة استخدام تقنية الذكاء الاصطناعي لمساعدة غالبية السيدات المحبات للجمال، مثل الحصول على الإلهام بشأن المكياج وشراء منتجات التجميل المناسبة.

قبل وبعد مكياج التجميل، يكون التأثير مماثلاً لتغيير الوجه

بعد الدردشة العشوائية مع العشرات من خبراء التجميل، علم فريق ميرا أن أكبر صعوبة تواجهها المستهلكات حاليًا في العثور على منتجات المكياج وطرق التجميل المناسبة هي:لا يوجد صوت موثوق به يمكنه تقديم الإرشادات بشأن احتياجاتهم الجمالية الفردية.

في هذه المقالة سنتحدث عن كيفية استخدام الفريق الفني لشركة ميراتقنيات التعلم العميق والرؤية الحاسوبيةابحث عن أمثلة تصل إلى جوهر هذا السؤال: ابحث عن مؤثري الجمال والصور ومقاطع الفيديو التي تشرح أشكال العيون البشرية المحددة وألوان بشرة الوجه.

على طول الطريق، استفاد فريق ميرا من ثلاث قطع بسيطة ولكنها قوية من المعرفة:التحويلات الهندسية، ووظائف الخسارة الثلاثية، والتعلم الانتقالي،حل مشاكل الاستدلال على الجمال الصعبة بأقل قدر من التدخل البشري.

يساعدك الذكاء الاصطناعي على اختيار مكياج العيون الأنسب

مخطط تصنيف العين

تعلم النساء اللواتي يعشقن المكياج أنه قد يكون من الصعب العثور على منتجات وطرق تجميل تناسب عيونهن - فشكل العين ولون بشرة الوجه يختلفان من شخص لآخر.

حتى بالنسبة لنفس نوع مكياج العيون (مثل مكياج العيون الدخاني)، فإن طرق المكياج المستخدمة تختلف كثيرًا اعتمادًا على شكل العين.

على الرغم من أن Birchbox وشركات أخرى أطلقت بعض أدلة المكياج المفيدة، إلا أن فريق Mira وجد من خلال الاستطلاعات أن عشاق الجمال عمومًا يحبون الاستماع إلى النصائح المهنية والموثوقة، وخاصة نصائح المكياج من الأشخاص الذين لديهم أشكال عيون مماثلة لعيونهم. بل إنهم يقدرون هذه الاقتراحات أكثر من آراء خبراء التجميل.

باستخدام تكنولوجيا الذكاء الاصطناعي، يمكننا الآن معرفة كيفية وضع المكياج ومستحضرات التجميل التي يجب شراؤها بناءً على ملامح أعيننا وميزات الوجه الفريدة الأخرى.

الخطوة الأولى في جمال الذكاء الاصطناعي: إيجاد أوجه التشابه

دعونا نقوم بصياغة المشكلة رسميًا: بالنظر إلى مجموعة من صور الوجه وعدد صغير من الصور المسمى يدويًا (المسمى بلون العين وشكل الجفن وما إلى ذلك)، ابحث عن المسافة بين العينين.مقاييس التشابه البصري(هذا هو المقصود بـ "لقد رأيت هذه الأخت من قبل" في "حلم القصور الحمراء"). ثم استخدمالمصنفيلتقط خصائص العلامات البشرية.

ستركز هذه المقالة أولاً على كيفية تحديد التشابه بين العيون، ثم تشرح بالتفصيل كيفية تنفيذ مهمة التصنيف.

الصور الخام ليست مناسبة جدًا لحساب التشابه البصري أو أداء مهام التصنيف. لأن العديد من أوجه التشابه التي تحتويها سطحية (على سبيل المثال، المكياج مشابه جدًا، ويبدو لون البشرة مختلفًا بسبب الإضاءة القوية).

ليس لهذه أي علاقة ببنية عين الشخصية الفعلية ولون بشرة وجهها. علاوة على ذلك، تكون الصور الأصلية عمومًا في مساحة عالية الأبعاد، مما يتطلب كمية كبيرة من بيانات التدريب المصنفة لمهام التصنيف.

كما هو موضح أعلاه، إذا قمت بمقارنة بكسلات الصورة فقط بشكل مباشر، فإن عيون الشخصيات متشابهة للغاية، ولكن إذا نظرت عن كثب، فستجد أنه على الرغم من أن ظلال عيون الشخصيات والإضاءة وخط الرؤية متسقة، فإن لون عيونهم ولون بشرة وجوههم مختلفان.

صعوبة معالجة الصور الخام: على الرغم من أن عيون الشخصين في الصورة أعلاه مختلفة جدًا، إلا أن البيانات الأولية متشابهة جدًا بالمقارنة

المهام الأولى لميرا هي:للحصول على تمثيل رياضي منخفض الأبعاد وكثيف لصورة العين،هذا ما نسميه "التعشيش(التضمينات).

إنه يلتقط فقط جودة الصورة المطلوبة للمهمة (التضمين هو ميزة تصنيفية تُمثَّل كميزة ذات قيمة متصلة. عمومًا، يشير التضمين إلى تعيين متجه عالي الأبعاد إلى مساحة منخفضة الأبعاد). بهذه الطريقة، يجب أن يتجاهل "التضمين" هذه المعلومات:

  • وضعية العين/اتجاه النظر
  • ظروف الإضاءة المحددة (والمرشحات القوية، بالطبع)
  • بغض النظر عن نوع المكياج الذي تضعينه على وجهك
عند تدريب تضمينات العين باستخدام وظيفة الثلاثية، يتعلم النظام تجاهل الميزات غير ذات الصلة.

خطوة مكياج الذكاء الاصطناعي 2: تطبيع الصورة من خلال تحويل الإسقاط

يمكننا القيام بذلك من خلال خطوة معالجة مسبقة بسيطة -تغييرات الإسقاطإزالة التشابه السطحي لفئة بأكملها.

على الرغم من وجود العديد من الاختلافات البنيوية الواضحة في صور العين المقصوصة (مثل عدم تركيز العينين في الصورة، أو تدويرهما بسبب إمالة الرأس، وما إلى ذلك)، فإن تغييرات الإسقاط تسمح لنا "تويست"أغنية"وفققطعة،ويضمن هذا أن تكون معالم العين نفسها في نفس الإحداثيات.

مع القليل من المساعدةالجبر الخطيمن حيث المبدأ، يمكننا "تشويه" صورة بحيث يتم تعيين مجموعة من النقاط إلى شكل مثالي جديد. تتم عملية تدوير الصورة وتمديدها على النحو التالي:

من خلال استخدام تباين الإسقاط، يمكن تشويه الصورة أعلاه. ستشكل النقاط الحمراء الأربع في الصورة أعلاه مستطيلًا، وبالتالي "تصويب" النص المحيط بالنقاط الحمراء. وقد طبق فريق ميرا نفس النهج عند تطبيع صور العين.

ثم استخدم الباحثون dlib لاكتشاف المعالم الوجهية (إذا كنت مهتمًا بـ dlib، فيمكنك معرفة المزيد عنه في الرابط التالي: http://blog.dlib.net/2014/08/real-time-face-pose-estimation.html).

قم بقص العيون في صورتك وتشويهها للتأكد من محاذاتها وتناسقها. وقد أتاحت لهم هذه الخطوة التركيز على جعل "التعشيش" مستقلاً عن وضعية رأس الشخصية وزاوية ميلها.

التاليتطبيع الصورة:اكتشف المعالم الموجودة على الوجه، وقم بقص صورة العين، ثم استخدم التحويل الإسقاطي "لتشويه" صورة العين إلى موضع قياسي.

AI Beauty الخطوة 3: التعلم التمثيلي باستخدام دالة الخسارة الثلاثية

عند مقارنة الصور "المشوهة" بشكل مباشر، فإنها لا تزال تُظهر بعض أوجه التشابه السطحية، بما في ذلك اتجاه النظرة والتركيب المتشابه. تعتبر تقنية التعلم العميق هي الحل لهذه المشكلة.

قام الباحثون بتدريبالشبكات العصبية التلافيفيةإن تغذية صور العين سوف يؤدي إلى إخراج متجهات متشابهة أكثر بين صور العين لنفس الشخص مقارنة بالأشخاص المختلفين.تتعلم الشبكة العصبية كيفية إخراج تمثيل ثابت ومستمر لكل عين على حدة في سياقات مختلفة.

وبطبيعة الحال، ما نعتمد عليه هنا هو بالضبط ما قلناه من قبل. وظيفة فقدان الثلاثي،الصيغة هي كما يلي:

يوضح هذا بالتفصيل أنه عندما تضع الوظيفة "العشين" لفرد معين (المرساة والعينة الإيجابية) أقرب من المرساة والفرد غير ذي الصلة (العينة السلبية)، فإن هدف الخسارة والتحسين في النموذج سوف ينخفض.

وعندما أدخل الباحثون صور العيون في نموذجهم، وجدوا أن "التضمين" الناتج قام بعمل جيد في ملاحظة متى كانت الصورتان تحتويان على هياكل عيون مماثلة ولون بشرة الوجه.

أمثلة على الصور ذات التعشيش العيني المتشابه

الطريقة المستخدمة هنا تشبه في الواقع إلى حد كبير FaceNet من Google، والتي تتلخص في إنشاء تضمين صورة على مستوى الوجه من خلال "تشويه" ومعالجة الصور بشكل متسق وتطبيق دالة الخسارة الثلاثية.

AI Beauty الخطوة 4: الدمج والتداخل

قام الباحثون ببساطة بضبط التضمين الناتج لدعم تمثيل العين على مستوى الإنسان - واستخراج جميع بيانات الضوضاء لكل إطار.

وباستخدام الأوزان المدربة مسبقًا للشبكة العصبية أعلاه، اعتمد الباحثون دالة خسارة جديدة تضع القيم المتوسطة للمجموعات المتداخلة المتعددة في مواضع قريبة جدًا (بالنسبة للأفراد غير المرتبطين)، كما هو موضح أدناه:

وباستخدام الأوزان المدربة مسبقًا لشبكة عصبية سابقة، تمكن الباحثون من تعليم الشبكة كيفية دمج تعشيشات العين معًا بطريقة متوسطة، وشاهدوا النموذج يتقارب بسرعة. هذه العملية كثيرا ما يقال عنهانقل التعلم.

يتيح التعلم الانتقالي دمج التضمينات في تمثيل أكثر شمولاً للعين الفردية. على الرغم من أن بنية الشبكة العصبية معقدة للغاية في هذه المرحلة، إلا أنه يمكن استخدام النموذج بسبب استخدام التعلم الانتقاليالتقارب السريع.

وأخيرًا، استخدم الباحثون مجموعة البيانات للتحقق من النموذج ووجدوا أن التضمين الناتج عن النموذج كان قادرًا علىالتقاط أوجه التشابه الدقيقة للغاية بين الأفراد،كما هو موضح أدناه:

إن تعشيش العين لكل صف من الأحرف متشابه جدًا

نظرة واحدة فقط إليك وستقدم لك اقتراحات مكياج مثالية

ومن خلال الحصول على تمثيل رياضي عالي الجودة لعين الشخص في صورة واحدة، تمكن الباحثون من إيجاد أوجه تشابه في بنية عيون الأشخاص، مما يضع الأساس لمطابقة الشخص مع أسلوب مكياج العيون المناسب بناءً على عينيه فقط.

وقال الفريق الفني لميرا إن المهمة القادمة هي تطبيق عدةأساليب التعلم الخاضعة للإشراف(تصنيف أشكال العين، وإرجاع ألوان العين، وما إلى ذلك)، بالإضافة إلى بعض أساليب التحليل، لبناء نظام يمكن أن يساعد الناسنموذج الذكاء الاصطناعي الذي يقدم اقتراحات المكياج.

بمعنى آخر، في المستقبل، لن تضطر الفتيات بعد الآن إلى القلق بشأن نوع المكياج الأفضل لعيونهن ولون بشرتهن، ولن يضطررن بعد الآن إلى الرجوع ميكانيكيًا إلى أدلة المكياج القياسية واختبار تأثيرات الألوان لمدونات الجمال. سوف يوصيك الذكاء الاصطناعي بتقنيات المكياج الأكثر ملاءمة لك.

في هذه الحالة، هل قد يفقد مدونو الجمال وظائفهم؟ ومع ذلك، لم يعد يتعين على لي جيا تشي أن يبذل جهدًا كبيرًا لتجربة الألوان 380 مرة في بث مباشر واحد.