Quoi! L’apprentissage automatique peut-il être utilisé de cette manière ?
Il faut admettre que les Japonais ont l’imagination la plus développée au monde. Presque toute la société dominante est plongée dans une étrange atmosphère de deuxième dimension, de farces et d'otaku.
L'apprentissage automatique, une technologie aussi directe qu'un homme d'acier, est généralement utilisé pour la première fois dans des domaines lourds tels que la sécurité, la finance, la conduite autonome et la logistique, tant aux États-Unis qu'en Chine. Cela ne semble-t-il pas impressionnant ?
Lorsque l’apprentissage automatique de cet homme simple et direct a été appliqué au Japon, le style a soudainement changé.
Kenji Doi, un scientifique des données de Tokyo, a utilisé un modèle d’apprentissage automatique et AutoML Vision de Google pour classer les nouilles ramen.
Vous avez bien entendu, c’est vraiment du ramen.
Le but de ce projet est également étonnant. Kenji Doi veut utiliser l'apprentissage automatique pourDéterminez de laquelle des nombreuses succursales du célèbre restaurant de ramen japonais Ramen Jiro provient ce bol de nouilles. Jusqu'à présent, le modèle aurait une précision de 95 %.
À travers cette image animée, examinons l’ensemble de données de ce modèle :
Ramen Jiro est l'un des restaurants les plus populaires du Japon, avec 41 succursales à Tokyo seulement. Chaque restaurant partage le même menu, et même les bols utilisés pour servir les nouilles sont presque identiques. Associé à la méticulosité, à la précision et au savoir-faire des Japonais dans leur travail, je crois que chaque branche a un ensemble d'exigences strictes en matière de technologie et de normes de production.
Il est donc très difficile de déterminer à quelle branche appartient un bol de nouilles en regardant la photo. Même le chef lui-même a du mal à le faire.
Mais Kenji pense que l’apprentissage profond peut résoudre ce problème en identifiant certaines des plus petites différences.
RML (apprentissage automatique des ramen)
À cette fin, il a commencé à goûter en profondeur les aliments dans chaque magasin. (erreur)
Il a construit un modèle d’apprentissage automatique pour classer les nouilles ramen et voulait voir s’il pouvait faire le travail plus efficacement en utilisant AutoML Vision de Google.
AutoML Vision crée des modèles ML personnalisés pour identifier les animaux sauvages ou les types de produits. En théorie, il pourrait donc être utilisé pour classer les nouilles ramen. Et c'est facile à utiliser, il suffit de télécharger les images bien étiquetées et de cliquer sur confirmer.
Dans le cas de Kenji, il a compilé un ensemble de 48 000 photos de bols dans les magasins Ramen Jiro de Tokyo, ainsi que les étiquettes de chaque magasin, et les a téléchargées sur AutoML Vision. Le modèle a fonctionné pendant environ 24 heures pour effectuer la reconnaissance et a obtenu des résultats prometteurs : le modèle de Kenji a atteint une précision de 94,5 % dans la prédiction de l'emplacement des magasins à partir de photos.
La façon dont AutoML détecte la différence dans les nouilles ramen n’est certainement pas une question de goût. Après tout, les GPU n’ont pas de langue.
La première hypothèse de Kenji était que le modèle était identifié par la couleur ou la forme des bols et des tables, mais le design était très similaire dans chaque branche. En réponse à cela, la deuxième tentative de Kenji a été d'utiliser la quantité et la présentation des ingrédients, l'épaisseur de la viande et la couleur de la marinade. Ces différences sont imperceptibles pour les gens ordinaires et difficiles à juger à l’œil nu. Mais grâce à l’apprentissage automatique, cela devient simple et quantifiable.
AutoML Vision est facile à utiliser, si simple qu'il peut être utilisé sans beaucoup de connaissances en programmation. Cela facilite également la recherche des experts non informaticiens. Attendons avec impatience d’autres tentatives intéressantes.
Il existe trop de mauvaises façons de jouer à l'IA au Japon
En fait, comparé aux ramen, le Japon dispose de technologies d’intelligence artificielle plus intéressantes, toutes appliquées à la culture bidimensionnelle.
Un clic pour ajouter des oreilles de chat
Dans ce gadget,Les utilisateurs n'ont qu'à faire glisser l'image sur la page Web et l'algorithme ajoutera automatiquement une oreille d'animal appropriée en fonction de l'angle d'inclinaison de la tête du personnage et du style général de la peinture.
La couleur des oreilles peut également changer en fonction de la couleur des cheveux du personnage.En plus des oreilles de chat, vous pouvez également changer pour des oreilles de lapin, des oreilles de chien, des oreilles de renard...
L’apprentissage profond utilise certainement l’étape de reconnaissance d’image. Ce projet utilise certains paramètres fournis par la bibliothèque de reconnaissance faciale bidimensionnelle AnimeFace. Afin d'améliorer la précision de la reconnaissance faciale, AnimeFace a accumulé 70 000 images faciales et 300 millions de données d'entraînement d'images non faciales, et a finalement obtenu l'effet d'identifier avec précision la couleur du visage, de la peau, des cheveux et des yeux.
La photo de ma femme ne sera pas déformée, quelle que soit sa taille.
Cet outil « Waifu2x » est bien connu parmi les ingénieurs 2D pour son nom amusant et direct et son côté pratique. En prononciation japonaise, « femme » se prononce « waifu » et 2x signifie multiplier par deux.
Waifu2x est un outil d'agrandissement d'image destiné uniquement aux images de style anime. Il peut agrandir sans perte les petites images floues de deux fois, réduire le bruit et adoucir les courbes.On peut sentir l'amour de l'auteur pour les belles filles bidimensionnelles à partir du nom.
L'algorithme de Waifu2x est basé sur la technologie des réseaux neuronaux convolutifs. L'auteur a appris des dizaines de milliers d'images de filles d'anime et des dizaines de milliers de vignettes correspondant aux images originales avec la moitié de la largeur et de la hauteur, et lui a appris à agrandir les vignettes pour restaurer autant que possible les images originales.
Avec une telle initiative et une telle imagination, peut-être qu’un jour, le monde bidimensionnel pourra réellement sauver le monde.