HyperAI超神経

優秀な頭脳を持った日本人はAIに本気で取り組むことすらない

7年前
情報
Sparanoid
特色图像

ナニ!機械学習は今後もこのように使用できますか?

私は日本人が世界で最も発展しているはずであることを認めざるを得ません。主流社会のほぼ全体が、二次元、悪ふざけ、そして家庭の腐敗といった奇妙な雰囲気に浸っています。

そして、「機械学習」という鋼のようにまっすぐな技術は、開発が先行している米国でも中国でも、セキュリティ、金融、自動運転、物流などのヘビーデューティーな分野で一般的に使われています。とても横暴に聞こえませんか?

そんな真っ直ぐな男の機械学習が日本に来て、画風が激変した。

東京のデータサイエンティスト、土井健司氏は、機械学習モデルと Google の AutoML Vision を使用してラーメンの麺を分類しました。

聞いての通り、本当にラーメンです。

このプロジェクトの目的も、土井健司氏が機械学習を使って実現したいと考えています。日本の有名なラーメン店「ラーメン二郎」の多くの支店のうち、この麺がどの支店のものかを調べてください。現時点でこのモデルの精度は95 %と言われています。

このモデルのデータセットについては、次のアニメーションを通じて学習します。

優秀な頭脳を持った日本人はAIに本気で取り組むことすらない

ラーメン二郎は日本で最も人気のあるレストランの1つであり、東京だけで41店舗があります。どの店もメニューは同じで、麺を提供する器もほぼ同じ。日本人の細やかな精度や職人技と相まって、各支店の生産技術やレベルには厳しい要求があると思います。

そのため、麺の写真を見ただけで、それがどの支店に属しているかを判断するのは非常に困難です。頻繁に料理をする人自身でも、それを行うのは難しいでしょう。

しかし、Kenji Jiang 氏は、ディープラーニングがいくつかの小さな違いを特定することでこの問題を解決できると信じています。

RML(ラーメン機械学習)

そのために、彼は店から店へと深く味わい始めました。 (エラー)

優秀な頭脳を持った日本人はAIに本気で取り組むことすらない

彼はラーメンの麺を分類するための機械学習モデルを構築し、Google の AutoML Vision を使用してその作業をより効率的に実行できるかどうかを確認したいと考えていました。

AutoML Vision は野生動物や製品の種類を識別するカスタム ML モデルを作成するため、理論的にはラーメンの分類に使用できます。操作は簡単で、適切にタグ付けされた画像をアップロードして確認をクリックするだけです。

Kenji の場合、東京のラーメン二郎支店の住所と各店舗のラベルに基づいて 48,000 枚の丼の写真をまとめ、AutoML Vision にアップロードしました。モデルは認識を実行するために約 24 時間実行され、興味深い結果が得られました。Kenji のモデルは、写真から店舗の場所を 94.5% の精度で予測しました。

優秀な頭脳を持った日本人はAIに本気で取り組むことすらない

AutoML がラーメンの麺の違いをどのように検出するかは、明らかに味の問題ではありません。結局のところ、GPU には舌がありません。

賢治の最初の仮説は、モデルはボウルやテーブルの色や形で識別できるが、各支店のデザインは非常に似ているというものでした。この点において、賢治の2番目の試みは、材料の量と表現、肉の厚さ、マリネの色を使用することです。これらの違いは、一般の人には見えず、肉眼では判断することが困難です。しかし、機械学習を通じて、それはシンプルかつ定量化可能になります。

AutoML Vision は操作が簡単で、プログラミングの基礎がなくても使用できるため、コンピューターの専門家以外の研究も容易になります。

日本ではAIをプレイする不公平な方法が多すぎる

実はラーメンに比べて日本には興味深い人工知能技術があり、それらはすべて二次元文化に応用されています。

ワンクリックで猫耳を追加

優秀な頭脳を持った日本人はAIに本気で取り組むことすらない

このガジェットでは、ユーザーは画像を Web ページにドラッグするだけで、アルゴリズムがキャラクターの頭の傾き角度と全体的な描画スタイルに基づいて適切な動物の耳を自動的に追加します。

キャラクターの髪の色に合わせて耳の色も変わります。猫耳以外にもウサギ耳、犬耳、キツネ耳などに変更することも可能です。

もちろん、深層学習では画像認識ステップが使用されます。このプロジェクトでは、2 次元顔認識ライブラリ AnimeFace によって提供されるいくつかのパラメーターが使用されます。 AnimeFace は顔認識の精度を向上させるために、7 万枚の顔画像と 3 億枚の非顔画像の学習データを蓄積し、最終的に顔、肌、髪、目の色を正確に識別する効果を達成しました。

優秀な頭脳を持った日本人はAIに本気で取り組むことすらない

妻の写真がどんなに大きくても歪まない

このツール「Waifu2x」は、その興味深く直接的な名前と実用性で2Dエンジニアの間で有名です。日本語の発音では「妻」を「ワイフ」と発音し、2xは2を掛けることを意味します。

優秀な頭脳を持った日本人はAIに本気で取り組むことすらない

Waifu2x は、アニメスタイルの画像専用の画像拡大ツールです。ノイズを軽減し、曲線を柔らかくしながら、ぼやけた小さな画像をロスレスで 2 倍に拡大できます。名前からも作者の二次元美少女に対する愛情が感じられます。

Waifu2x のアルゴリズムは畳み込みニューラル ネットワーク技術に基づいており、作者は美しいアニメの女の子の写真と、元の写真に対応し幅と高さが 2 倍になった数万のサムネイルを学習して、次の方法を学習できるようにしました。サムネイルから拡大して、できるだけ元の画像を復元してください。

このような機動力と想像力があれば、いつか二次元が本当に世界を救うことができるかもしれません。