ماذا! هل يمكن استخدام التعلم الآلي بهذه الطريقة؟
علينا أن نعترف بأن اليابانيين لديهم الخيال الأكثر تطوراً في العالم. يكاد يكون المجتمع بأكمله منغمسًا في جو غريب من البعد الثاني والمقالب والأوتاكو.
التعلم الآلي، وهي تقنية صريحة كالرجل الفولاذي، تُستخدم عمومًا لأول مرة في المجالات الشاقة مثل الأمن، والتمويل، والقيادة الذاتية، والخدمات اللوجستية، سواء في الولايات المتحدة أو الصين. ألا يبدو هذا مثيرا للإعجاب؟
عندما تم تطبيق التعلم الآلي لهذا الرجل المباشر على اليابان، تغير الأسلوب فجأة.
استخدم كينجي دوي، عالم بيانات من طوكيو، نموذج التعلم الآلي وبرنامج AutoML Vision من Google لتصنيف معكرونة الرامين.
لقد سمعت ذلك بشكل صحيح، إنه رامين حقًا.
والغرض من هذا المشروع مدهش أيضًا. يريد كينجي دوي استخدام التعلم الآلي لـحدد من أي فرع من فروع مطعم رامين الياباني الشهير رامين جيرو يأتي هذا الطبق من المعكرونة. ويقال حتى الآن أن دقة النموذج تبلغ 95 %.
من خلال هذه الصورة المتحركة، دعونا نلقي نظرة على مجموعة البيانات لهذا النموذج:
يعد مطعم رامين جيرو أحد المطاعم الأكثر شعبية في اليابان، حيث يملك 41 فرعًا في طوكيو وحدها. يتشارك جميع المطاعم في نفس القائمة، وحتى الأوعية المستخدمة لتقديم المعكرونة متطابقة تقريبًا. وبالإضافة إلى الدقة والإتقان والحرفية التي يتميز بها اليابانيون في عملهم، أعتقد أن كل فرع لديه مجموعة من المتطلبات الصارمة فيما يتعلق بتكنولوجيا الإنتاج والمعايير.
لذلك فمن الصعب حقًا معرفة أي فرع ينتمي إليه وعاء المعكرونة بمجرد النظر إلى الصورة. حتى الشيف نفسه يجد صعوبة في القيام بذلك.
لكن كينجي يعتقد أن التعلم العميق يمكن أن يحل هذه المشكلة من خلال تحديد بعض الاختلافات الأصغر.
RML (تعلم الآلة بالرامين)
ولتحقيق هذه الغاية، بدأ بتذوق الطعام بعمق في كل محل. (خطأ)
قام ببناء نموذج التعلم الآلي لتصنيف المعكرونة سريعة التحضير، وأراد أن يرى ما إذا كان بإمكانه القيام بالمهمة بكفاءة أكبر باستخدام AutoML Vision من Google.
يقوم AutoML Vision بإنشاء نماذج تعلم آلي مخصصة لتحديد الحيوانات البرية أو أنواع المنتجات، لذا من الناحية النظرية، يمكن استخدامه لتصنيف معكرونة الرامين. ومن السهل استخدامه، فقط قم بتحميل الصور التي تم وضع العلامات عليها جيدًا وانقر فوق تأكيد.
في حالة كينجي، قام بتجميع مجموعة مكونة من 48000 صورة للأوعية في مواقع رامين جيرو في طوكيو، بالإضافة إلى ملصقات لكل متجر، وقام بتحميلها إلى AutoML Vision. تم تشغيل النموذج لمدة 24 ساعة تقريبًا لإجراء التعرف، وحقق نتائج واعدة: حقق نموذج كينجي دقة بنسبة 94.5% في التنبؤ بمواقع المتاجر من الصور.
إن الطريقة التي يكتشف بها AutoML الفرق بين المعكرونة سريعة التحضير لا تتعلق بالتأكيد بالذوق. بعد كل شيء، وحدات معالجة الرسومات لا تحتوي على ألسنة.
كانت فرضية كينجي الأولى هي أن النموذج تم التعرف عليه من خلال لون أو شكل الأوعية والطاولات، لكن التصميم كان متشابهًا جدًا في كل فرع. وردًا على ذلك، كانت المحاولة الثانية التي قام بها كينجي هي استخدام كمية المكونات وتقديمها، وسمك اللحم ولون التتبيلة. هذه الاختلافات غير محسوسة بالنسبة للأشخاص العاديين ومن الصعب الحكم عليها بالعين المجردة. ولكن من خلال التعلم الآلي، أصبح الأمر بسيطًا وقابلًا للقياس.
يعد AutoML Vision سهل التشغيل، لدرجة أنه من السهل استخدامه دون الحاجة إلى معرفة كبيرة بالبرمجة. وهذا يسهل أيضًا عملية البحث التي يقوم بها الخبراء غير المتخصصين في علوم الكمبيوتر. دعونا نتطلع إلى المزيد من المحاولات المثيرة للاهتمام.
هناك الكثير من الطرق غير السليمة للعب الذكاء الاصطناعي في اليابان
في الواقع، بالمقارنة مع الرامن، تمتلك اليابان تقنيات الذكاء الاصطناعي الأكثر إثارة للاهتمام، والتي يتم تطبيقها جميعها على الثقافة ثنائية الأبعاد.
بنقرة واحدة لإضافة آذان القطة
في هذه الأداة،كل ما يحتاجه المستخدمون هو سحب الصورة إلى صفحة الويب، وسوف تقوم الخوارزمية تلقائيًا بإضافة أذن حيوان مناسبة استنادًا إلى زاوية إمالة رأس الشخصية والأسلوب العام للوحة.
يمكن أن يتغير لون الأذنين أيضًا وفقًا للون شعر الشخصية.بالإضافة إلى آذان القطط، يمكنك أيضًا التغيير إلى آذان الأرنب، آذان الكلاب، آذان الثعلب...
من المؤكد أن التعلم العميق يستخدم خطوة التعرف على الصورة. يستخدم هذا المشروع بعض المعلمات التي توفرها مكتبة التعرف على الوجه ثنائية الأبعاد AnimeFace. من أجل تحسين دقة التعرف على الوجه، قام AnimeFace بتجميع 70000 صورة وجه و300 مليون بيانات تدريب للصور غير الوجهية، وأخيرًا حقق تأثير التعرف الدقيق على لون الوجه والبشرة والشعر ولون العين.
صورة زوجتي لن يتم تشويهها مهما كان حجمها
تُعتبر هذه الأداة "Waifu2x" معروفة جيدًا بين مهندسي 2D بسبب اسمها المضحك والمباشر وعمليتها. في النطق الياباني، يتم نطق "زوجة" كـ "وايفو"، و2x يعني الضرب في اثنين.
Waifu2x هي أداة لتكبير الصور مخصصة فقط للصور ذات الطراز الأنيمي. يمكنه تكبير الصور الصغيرة الضبابية بمقدار الضعف دون فقدان الجودة، وتقليل الضوضاء، وتنعيم المنحنيات.يمكننا أن نشعر بحب المؤلف للفتيات الجميلات ثنائيات الأبعاد من الاسم.
تعتمد خوارزمية Waifu2x على تقنية الشبكة العصبية التلافيفية. تعلم المؤلف عشرات الآلاف من صور فتيات الأنمي وعشرات الآلاف من الصور المصغرة المقابلة للصور الأصلية بنصف العرض والارتفاع، وتركها تتعلم كيفية تكبير الصور المصغرة لاستعادة الصور الأصلية قدر الإمكان.
وبفضل هذه المبادرة والخيال، ربما يتمكن العالم ثنائي الأبعاد في يوم من الأيام من إنقاذ العالم حقًا.