HyperAI超神経

このペースではAIがデザイナーの仕事まで奪ってしまうのでしょうか?

7年前
情報
Sparanoid
特色图像

Google は最近、Auto Draw と呼ばれるスマート描画ソフトウェアをリリースしました。その名前が示すように、このソフトウェアはソフトウェア上でスケッチを描くことができ、似たような画像を自動的に選択します。これは、携帯電話の手書き入力機能によく似た、特に低レベルの人工知能ソフトウェアです。

このペースではAIがデザイナーの仕事まで奪ってしまうのでしょうか?

描画チート?

同じ時期に、アリ・エスラミと他の数人の科学者は、バイオニック思考と自己学習を備えた、よりインテリジェントな描画ソフトウェアを開発しました。このソフトウェアでできること: 画像を提供した後、「コピー」を描画できます。つまり、ソフトウェアはスキャナーのように単にスキャンして出力するのではなく、画像を描画する機能を備えています。

科学者の研究開発のアイデアは次のとおりです。

インスピレーション:

私たちは、人間は表面にあるもの以上のものを見ていることを発見しました。たとえば、建物を見るとき、私たちはそのデザインの複雑さに驚くだけでなく、建物の建設の職人技にも感謝します。現象を見抜き、本質を見抜くこの能力は、人間の知能が他の種よりも高い重要な理由です。したがって、私たちは人間と同じくらい賢い、あるいは人間の思考を模倣するソフトウェアを作りたいと考えています。たとえば、絵画を見るときに、そのソフトウェアが単に絵のピクセルを区別するだけでなく、その肖像画がどのように描かれているかを「理解」できるようにしたいと考えています。肖像画。

準備:装備

このソフトウェアに同じ描画ツールを装備したところ、数字、人物、肖像画の構築方法の違いを自動的に区別できることがわかりました。最も重要なことは、これらはデータセットでトレーニングされずに、自身の学習によって達成されるということです。これは、データセットから学習する必要がある他のプログラムとは対照的ですが、時間がかかる可能性があります。

エンジニアの設計アイデア

ステップ 1: 深層強化学習ソフトウェアの基礎知識

私たちはまず、コンピューターのペイント プログラムと対話するための深層強化学習ソフトウェアを設計しました。電子ペンを使用してデジタル タブレットに描画し、ブラシのサイズ、筆圧、色を自由に変更できます。しかし、訓練されていないため、ランダムなストロークのみが描画され、全体の構造は見えません。この問題を解決するために、より価値のある画像の制作を促進する賞罰メカニズムを確立することにしました。

ステップ 2: 識別子ニューラル ネットワークのアップグレード

次に、画像がソフトウェアによって描画されたのか、それとも実際の写真なのかを判断するための、ディスクリミネーターと呼ばれるニューラル ネットワークを設計しました。ソフトウェアで描いた絵が本物の写真であると判定されれば、ソフトウェアは「報酬」を得ることができます。実際、ソフトウェアの「報酬」は、識別子をだます方法を学習することです。これは、以前のニューラル ネットワーク GANS (Generative Adversarial Networks) で使用されていた手法に似ていますが、違いは、GAN がピクセルを直接出力するのに対し、GAN はソフトウェアを介して実際の画像環境と対話してから画像を出力することです。

ステップ 3: MNIST および OMNIGLOT データセットのトレーニング

最初の実験セットでは、ソフトウェアは、MNIST データセットにあるものと同様の数字の画像を生成するようにトレーニングされ、識別器をだまして画像を生成することを試みることで、ソフトウェアは異なる数字のスタイルに適応するようにブラシを制御することを学習しました。 . これは、私たちがよく視覚化プログラムと呼ぶものです。

ステップ 4: 実在の人物データセットへの拡散

また、特定の画像トレーニング ソフトウェアを使用して、「コピー」画像を生成するように依頼し、その「コピー」画像がソフトウェアによって生成されたものであるかどうか、および元の画像のコピーであるかどうかを識別器に判断させます。区別が難しいほど、「報酬」は大きくなります (ソフトウェアがより多く学習するほど)。重要なのは、ソフトウェアがシミュレートされたブラシを制御する一連のアクションを保存していることです。これは、シミュレーション中に学習した内容を、ロボット アーム上で実際の人間をシミュレートするなど、他の同様の環境に適用できることを意味します。ビデオのスクリーンショットは次のとおりです。

このペースではAIがデザイナーの仕事まで奪ってしまうのでしょうか?

さらに、フレームワークを実際のデータセットに拡張して、有名人の顔の表情を描くトレーニングを行う場合、ソフトウェアは、ちょうどストリートアーティストが絵をスケッチするのと同じように、顔の主な特徴、つまり形状、色調、髪型をキャプチャできます。数ストロークのポートレート。

このペースではAIがデザイナーの仕事まで奪ってしまうのでしょうか?

何が起こっているのか、なぜそれが起こっているのかを知ることは、人間が簡単に持つことができ、頻繁に使用できる能力です。この研究では、ソフトウェアが絵画を見て、それがどのように描かれたかを「理解」できるようにすることに成功しました。この期間に、ビジュアル プログラミングのテクニックや因果関係の簡潔な表現も学びました。

これはほんの小規模な研究にすぎませんが、人工知能が人間のような認知能力、汎化能力、分析能力、コミュニケーション能力を持つことを可能にするその後の技術が不可欠です。デザイナーを短期間で置き換えることは不可能ですが、あるいは「Adobe ファミリーのバケット」の誰かを置き換えることも不可能ではありますが、自動描画ソフトウェアの出現により、人工知能の別の興味深い有望なアプリケーションのシナリオが見られるようになったのは否定できません。 。