HyperAI超神経

AI は脇役から C ポジションまで Google I/O の主力になりました

6年前
見出し
Dao Wei
特色图像

2019 年の Google I/O カンファレンスへのカウントダウンが始まり、その過程でその AI ラインナップはますます強力になってきました。今日は、Google I/O カンファレンスで誕生した、あなたが知っている、そして知らない AI 製品を分析してみましょう。

今年は Google I/O カンファレンスが始まります 「AIファースト」この戦略は2016年のカンファレンスから4年目となり、毎年カンファレンスで彼らが世界に披露してきたAIブラックテクノロジーを見ることができる。

2017 年から Google I/O カンファレンスは完全に AI First に移行し始めました

2016年にはGoogleアシスタントやスマートスピーカーなどAI要素が正式に追加され、2017年にはモバイルファーストからAIファーストへというテーマになりました。

2018 年までに、I/O カンファレンスは完全に AI のホームショーとなり、正真正銘のイベントになりました。 AIのみ

今年のカンファレンスを前に、I/Oカンファレンスで生まれたAI製品を一緒に振り返ってみましょう。今年の新作リリースの宿題もしてください。

進化し続けるGoogleアシスタント

2016 年の Google I/O カンファレンスで、Google は人工知能の傑作である Google アシスタントを発表しました。これは、Google Now、人工知能、機械深層学習に基づいたインテリジェントな音声アシスタントです。

ユーザーは、Google アシスタントに「OK Google」というキーワードを言うだけで起動できます。 

ユーザーは声を使って Google アシスタントにさまざまな操作を依頼できます。たとえば、公演の予約や発券状況を調べたり、何かを思い出したり、カレンダーにメモを書き込んだりするなどです。そして最も重要なことは、Google アシスタントが常に改善されていることです。ユーザーが使えば使うほど賢くなります。

2017 年までに、より強力な機能と幅広いアプリケーション シナリオを備えた新しい Google アシスタントが iPhone 上でリリースされることに成功しました。 Google CEOのサンダー・ピチャイ氏もカンファレンスで、GoogleアシスタントはGoogleの機械学習技術の最も重要な製品またはサービスキャリアであると述べた。

今年の「AI ファースト」テーマを反映して、Google アシスタントは音声、テキスト、画像の 3 つの側面で複数のアップデートを行っています。以前のバージョンでは音声入力のみに対応していましたが、アップデート後はテキストや画像の入力にも対応できるようになりました。また、新しいバージョンは、Google 独自の製品でのみ使用されるものではなく、開発者向けに SDK をリリースし、他のスマート ホーム メーカーと協力しています。

2018 年の I/O カンファレンスでは、Google アシスタントの新しいバージョンが発表されました。新しいバージョンでは、マルチタスク応答が実装され、自然言語対話と状況に応じたシナリオでの複数ラウンドの対話がサポートされています。

新しい「サウンド」は、新バージョンの最大のハイライトの1つとなっています。 DeepMind社のWavenet技術の採用により、6種類の非常に自然な「人間の声」を提供することができ、その音色は本物と見間違えるほど完璧です。また、超リアルな「うーん」という声だけで十分であるなど、人の口調をより模倣することも学びました。

美容師との会話で、Google アシスタントは聴衆からの歓声に「うーん」と言いました 

技術的な進歩により、Google アシスタントの認識精度はより高いレベルに引き上げられ、より幅広い AI シナリオで役割を果たす可能性が生まれました。

Google アシスタントをベースに開発された Google Home スマート スピーカーも、優れた機能を実行するために更新と反復が行われ、優れたスマート ホーム製品になりました。

Google の強力なコア: TPU

Google は、2016 年の I/O カンファレンスで初めて第 1 世代の TPU (Tensor Processing Unit) を発表し、その後毎年アップグレードをリリースしました。

TPU は、機械学習専用に設計されたチップです。実際、発表前から、AlphaGo の予測および意思決定技術の基礎として使用され、成功していました。

第 1 世代の TPU は推論を重視し、コンピューティングのパフォーマンスに重点を置いており、その効率は GPU よりもはるかに高くなります。

2017 年の I/O カンファレンスで正式に発表された第 2 世代 TPU は、学習と推論における人工知能の能力をさらに深めました。推論のみを実行できる第 1 世代の TPU と比較して、ニューラル ネットワークのトレーニングにも使用できます。

第 2 世代 TPU は、1 秒あたり最大 180 兆演算の浮動小数点演算能力を備えており、これは従来の GPU と CPU のそれぞれ 15 倍と 30 倍です。

2018 年、I/O カンファレンス全体の C ポジションは TPU に与えられました。Google が深層学習用に構築したこのテンソル プロセッサは、人工知能の分野における Google の最も強力な武器となりました。

昨年リリースされたもののまだ一般公開されていない TPU 2.0 と比較すると、TPU 3.0 のコンピューティング ピークは 8 倍です。

TPU 3.0はNvidiaのGPUに大きな脅威をもたらす

パフォーマンスの向上には代償も伴います。大量の熱が発生するため、エンジニアはラジエーターを真鍮の導管に交換する必要がありました。ご想像のとおり、Sundar Pichai 氏も、この世代の TPU の冷却ソリューションは液体冷却であると認めました。Google が液体冷却方式を導入したのはこれが初めてです。

問題解決カメラ Google レンズ

Google レンズは 2017 年に初めてリリースされました。これは、画像認識と OCR テクノロジーに基づいた人工知能アプリケーションであり、写真を見て物体を認識できます。その使用シナリオには、次のようなものがあります。 Google 翻訳との統合。

Google レンズを使用して旅行のランドマークを特定する

1 年後、Google レンズは認識に加えて、認識された情報に基づくオブジェクト スタイル マッチングとリアルタイム シーン マッチングのサポートも追加できるようになります。ユーザーは、Google レンズを通じて興味のあるオブジェクトの写真を撮り、同様のスタイルの製品を入手できます。

歌手のポートレートを認識すると、ピクチャー・イン・ピクチャー・モードで歌手のMVを再生できるなど、優れた機能もあります。

さらに、OnePlus、Asus、Xiaomi など、多くのデバイス メーカーのサポートが追加されました。

N お手入れの詳細

さらに、年次カンファレンスでは、よりインテリジェントになったいくつかのコア製品が登場し、細部へのこだわりからGoogleの意図が見えてきました。

Gメール

昨年、Gmail にはスマート作成機能が追加されました。この機能は、機械学習を使用して文の残りの入力を促すことができ、ユーザーがメールを迅速に編集し、インテリジェントなテキスト補足を提供できるようにします。

Googleマップ

Google は AI を活用し、AI と衛星画像を直接組み合わせて、より多くの企業や新しい住所を地図に追加します。 AI を活用した Google マップは、ビッグデータを通じて、よく行くレストランに基づいてお気に入りのグルメ レストランを推奨するなど、パーソナライズされた推奨事項も提供します。

Google ニュース

ビデオの字幕を自動的に追加および翻訳し、また、ニュースキャストと呼ばれる新しいビジュアル形式を開始します。これは、自然言語理解テクノロジーを使用して、単一のトピックに関する記事やビデオをユーザーに推奨します。

ここではこれ以上の詳細は説明しません。概要をわかりやすくするために、2016 年以降に Google I/O カンファレンスでリリースされた AI 製品とそのアップデートとアップグレードを次のように整理しました。

現在の状況から判断すると、今年のカンファレンスでは再び AI があらゆる場所で目にすることになると思います。 I/O カンファレンスは数時間後に始まります。楽しみに待ちましょう!

追伸: 好奇心を抑えられない学生は、以下のライブブロードキャストのリンクを保存して、北京時間の 5 月 8 日午前 1 時にオンタイムで視聴できます。

公式生放送アドレス:http://t.cn/Eo6MWU1

iQiyiライブブロードキャストアドレス:http://t.cn/Eoiz60J

新浪中国語同時通訳生放送アドレス:http://t.cn/Eo6xurx

新浪英語オリジナル生放送アドレス:http://t.cn/Eo6JlcJ