HyperAI

Die Japaner Haben Eine Einzigartige Vorstellungskraft, Und Selbst Ihre KI-Arbeit Ist Nicht Ernst

vor 7 Jahren
Information
Sparanoid
特色图像

Was! Kann maschinelles Lernen auf diese Weise eingesetzt werden?

Wir müssen zugeben, dass die Japaner die am weitesten entwickelte Vorstellungskraft der Welt haben. Fast die gesamte Mainstream-Gesellschaft ist in eine seltsame Atmosphäre der zweiten Dimension, der Streiche und Otaku eingetaucht.

Maschinelles Lernen, eine Einser-Technologie, wird sowohl in den führenden USA als auch in China im Allgemeinen zuerst in anspruchsvollen Bereichen wie Sicherheit, Finanzen, autonomes Fahren und Logistik eingesetzt. Klingt das nicht beeindruckend?

Als dieses geradlinige maschinelle Lernen auf Japan angewendet wurde, änderte sich der Stil plötzlich.

Kenji Doi, ein Datenwissenschaftler aus Tokio, verwendete ein maschinelles Lernmodell und Googles AutoML Vision, um Ramen-Nudeln zu klassifizieren.

Sie haben richtig gehört, es ist wirklich Ramen.

Auch der Zweck dieses Projekts ist erstaunlich. Kenji Doi möchte maschinelles Lernen nutzen, umFinden Sie heraus, aus welcher der vielen Filialen des berühmten japanischen Ramen-Restaurants Ramen Jiro diese Schüssel Nudel stammt. Bisher soll das Modell eine Genauigkeit von 95 % haben.

Werfen wir anhand dieses animierten Bildes einen Blick auf den Datensatz dieses Modells:

Die Japaner haben eine einzigartige Vorstellungskraft, und selbst ihre KI-Arbeit ist nicht ernst

Ramen Jiro ist eines der beliebtesten Restaurants in Japan und verfügt allein in Tokio über 41 Filialen. In jedem Restaurant gibt es die gleiche Speisekarte und sogar die Schüsseln, in denen die Nudeln serviert werden, sind fast identisch. In Verbindung mit der Sorgfalt, Präzision und Handwerkskunst der Japaner glaube ich, dass jede Branche strenge Anforderungen an Produktionstechnologie und -standards stellt.

Daher ist es wirklich schwierig, anhand des Bildes zu erkennen, zu welchem Zweig eine Schüssel Nudeln gehört. Sogar dem Koch selbst fällt dies schwer.

Kenji glaubt jedoch, dass Deep Learning dieses Problem lösen kann, indem es einige der kleinsten Unterschiede identifiziert.

RML (Ramen-Maschinelles Lernen)

Zu diesem Zweck begann er, die Lebensmittel in jedem Geschäft eingehend zu verkosten. (Fehler)

Die Japaner haben eine einzigartige Vorstellungskraft, und selbst ihre KI-Arbeit ist nicht ernst

Er erstellte ein maschinelles Lernmodell zur Klassifizierung von Ramen-Nudeln und wollte herausfinden, ob er diese Aufgabe mit Googles AutoML Vision effizienter erledigen konnte.

AutoML Vision erstellt benutzerdefinierte ML-Modelle zur Identifizierung von Wildtieren oder Produktarten und könnte daher theoretisch zur Klassifizierung von Ramen-Nudeln verwendet werden. Und die Verwendung ist ganz einfach: Laden Sie einfach die gut markierten Bilder hoch und klicken Sie auf „Bestätigen“.

In Kenjis Fall stellte er einen Satz von 48.000 Fotos von Schalen in den Tokioter Filialen von Ramen Jiro zusammen mit den Beschriftungen für jedes Geschäft zusammen und lud sie in AutoML Vision hoch. Das Modell lief etwa 24 Stunden, um die Erkennung durchzuführen, und erzielte vielversprechende Ergebnisse: Kenjis Modell erreichte eine Genauigkeit von 94,5 % bei der Vorhersage von Ladenstandorten anhand von Fotos.

Die Japaner haben eine einzigartige Vorstellungskraft, und selbst ihre KI-Arbeit ist nicht ernst

Wie AutoML den Unterschied zwischen Ramen-Nudeln erkennt, hat definitiv nichts mit dem Geschmack zu tun. Schließlich haben GPUs keine Zungen.

Kenjis erste Hypothese war, dass das Modell anhand der Farbe oder Form der Schüsseln und Tische identifiziert wurde, das Design jedoch in jeder Filiale sehr ähnlich war. Als Reaktion darauf bestand Kenjis zweiter Versuch darin, die Menge und Präsentation der Zutaten, die Dicke des Fleisches und die Farbe der Marinade zu nutzen. Diese Unterschiede sind für den Normalbürger nicht wahrnehmbar und mit bloßem Auge schwer zu beurteilen. Aber durch maschinelles Lernen wird es einfach und quantifizierbar.

AutoML Vision ist einfach zu bedienen, so einfach, dass es ohne große Programmierkenntnisse verwendet werden kann. Dies erleichtert auch Nicht-Informatikern die Recherche. Freuen wir uns auf weitere interessante Versuche.

Es gibt in Japan zu viele unangemessene Methoden, mit der KI zu spielen

Tatsächlich verfügt Japan im Vergleich zu Ramen über interessantere Technologien der künstlichen Intelligenz, die alle auf die zweidimensionale Kultur angewendet werden.

Katzenohren mit einem Klick hinzufügen

Die Japaner haben eine einzigartige Vorstellungskraft, und selbst ihre KI-Arbeit ist nicht ernst

In diesem GerätBenutzer müssen das Bild nur auf die Webseite ziehen und der Algorithmus fügt automatisch ein passendes Tierohr hinzu, basierend auf dem Neigungswinkel des Kopfes der Figur und dem Gesamtstil des Gemäldes.

Auch die Farbe der Ohren kann sich je nach Haarfarbe der Figur ändern.Neben Katzenohren können Sie auch auf Hasenohren, Hundeohren, Fuchsohren usw. umsteigen.

Deep Learning nutzt sicherlich den Schritt der Bilderkennung. Dieses Projekt verwendet einige Parameter, die von der zweidimensionalen Gesichtserkennungsbibliothek AnimeFace bereitgestellt werden. Um die Genauigkeit der Gesichtserkennung zu verbessern, sammelte AnimeFace 70.000 Gesichtsbilder und 300 Millionen Trainingsdaten von Nicht-Gesichtsbildern und erreichte schließlich den Effekt einer genauen Identifizierung von Gesicht, Haut, Haar und Augenfarbe.

Die Japaner haben eine einzigartige Vorstellungskraft, und selbst ihre KI-Arbeit ist nicht ernst

Das Foto meiner Frau wird nicht verzerrt, egal wie groß es ist

Dieses Tool „Waifu2x“ ist unter 2D-Ingenieuren für seinen lustigen und direkten Namen und seine Zweckmäßigkeit bekannt. In der japanischen Aussprache wird „Wife“ als „waifu“ ausgesprochen und 2x bedeutet „mit zwei multiplizieren“.

Die Japaner haben eine einzigartige Vorstellungskraft, und selbst ihre KI-Arbeit ist nicht ernst

Waifu2x ist ein Bildvergrößerungstool, das nur für Bilder im Anime-Stil geeignet ist. Es kann verschwommene kleine Bilder verlustfrei um das Zweifache vergrößern, Rauschen reduzieren und Kurven glätten.Die Liebe des Autors zu den zweidimensional schönen Mädchen ist schon im Namen spürbar.

Der Algorithmus von Waifu2x basiert auf der Convolutional-Neural-Network-Technologie. Der Autor lernte Zehntausende von Bildern von Anime-Mädchen und Zehntausende von Miniaturansichten, die den Originalbildern mit halber Breite und Höhe entsprechen, und ließ ihn lernen, wie man die Miniaturansichten vergrößert, um die Originalbilder so weit wie möglich wiederherzustellen.

Mit einer solchen Initiative und Vorstellungskraft kann die zweidimensionale Welt vielleicht eines Tages wirklich die Welt retten.