見出し
おすすめリスト
情報
Dao Wei
超神経質で
1月28日に開催された2019 Internet Spring Festival Galaでは、AIバーチャルホストがAIの代役と同じステージ上のホストの1人としてステージに上がり、その場で自身が司会を務めたと発表した。 AIがホストに取って代わる瞬間は本当に来るのか?
今年のオンライン春節ガラでは、Sa Beining、Zhu Xun、Gao Bo、Long Yang をベースにした 4 人のバーチャル イメージ ホストがデビューしました。 4 人のホストは全員、独自の仮想ホストと共同ホストし、パーティーをさらに楽しくしました。
ビデオからわかるように、仮想 AI ホストとエンティティの間には非常に類似点があり、電話に応答する点で人間と同じくらい優れており、賢いことに加えて、対応するボディランゲージもあり、各仮想ホストにも同様の特徴があります。さまざまな表現特性。
仮想ホストとは
報道によると、今回のオンライン春節祝賀会のバーチャルホストは、人の画像に基づいて仮想ミラーモデルを作成できるObENが開発したPAI(パーソナルAI)だという。
この製品のコア技術は主に次の 3 つの側面にあります。
まずは視覚イメージの確立です。ホストの写真と、3D スキャナー、3DS MAX、MAYA などの 3 次元モデリング ツールを使用して、AI はアルゴリズム モデルを構築し、写真の色の分布と構造の深さの関係を理解することで、最終的に顔と体の形状を構築できます。 。
2つ目は音の合成です。彼らが使用する AI 音声テクノロジーは、多数の音声ライブラリを収集する必要はなく、特徴パラメータ抽出、転移学習などの方法を通じて音声モデルを確立するだけで済みます。
最後に、仮想ホストをできるだけ現実的なものにします。これには、ビジュアルをサウンドと一致させるだけでなく、パーソナライズする必要もあります。 AI やモーション キャプチャ トレーニングと組み合わせたセンサーやモーション トラッキング機器を通じて、バーチャル ホストは、対応するオントロジーに従って、話し言葉、顔の表情、ジェスチャー、体の動き、シーンのインタラクションをシミュレートできます。
AI がホスティングに進出するのはこれが初めてですが、かなりの数の AI バーチャル アンカーが登場しています。
初のAIニュースキャスター
2018年11月に開催された第5回インターネットカンファレンスで、新華社は新しい記者の1人であるAIのプロトタイプである初のAI仮想合成ニュースアンカーである邱昊氏を披露し、次のように述べた。私の声には合っていますが、放送されている言葉を言ったことはありません...」
このビデオでは、ビデオ内のアンカーがなまりを使って自己紹介をしており、顔と唇が声に合わせて動いていることがわかります。驚きはありましたが、それでも少しがっかりしました。ライブアンカーと比較すると、機械化された製品であることが一目で分かります。その仕組みでは、人間がプレスリリースを書く必要もあります。しかし
このような総合的な技術サポートは、Sogou の「クローン技術」から生まれています。この技術の鍵となるのは音声合成と画像生成です。
音声合成技術は、少量の音声データを使用して、機械モデルが入力オブジェクトの発話特性を学習し、音色、リズム、感情などの側面を把握し、最終的に入力テキストの音声情報を実現することができます。
画像生成では、顔認識、三次元顔再構成、表情モデリングなどの学習と構築を使用し、最終的に出力音声情報と出力視覚情報の対応を実現します。
そうした欠点はさておき、この技術の最大の宣伝ポイントは、オンスクリーンアバター機能を実現できることであり、テレビやタブレット、携帯電話などを使って、一人の人間が3つの異なるコンテンツを同時に放送する様子を視聴できるということだ。
以前の AI アンカー
日本も先ほど報道しましたが、AIアンカーも作りました。
昨年4月、日本のNHKテレビ局「ニュースチェック11」という番組で、アンカーはかわいい漫画のAIアンカー「ニュースアンカー読子」でした。
このアンカーは CG テクノロジーを使用して作成され、多数の録音から音素を分割することを学習し、次にテキスト認識と読み取りを学習し、最終的にニュースを読み上げるために使用されます。
さらに、ニュースキャスターとしてロボットも導入されています。
大阪大学と京都大学が開発した美容ロボット「Elika」も、2018年4月にNNNテレビ局のニュースキャスターを務めた。
「エリカ」のキャラクターは23歳の美少女で、声は声優の録音を元に合成されており、非常に自然な声となっている。
また、人と会話する際にはマイクやセンサーを通じて情報を収集し、相手の声や動きを感知して相手のほうを向いてスムーズな会話を実現します。
目、口、首など19箇所が空気圧で動いてさまざまな表情を見せたり、簡単な動きもできるのでまるで本物のようです。
ホストはいつ置き換えられますか?
オンライン春節ガラといえば、エッチなバーチャルホスト4人の登場が大きな注目を集めたが、観客の態度からも彼らがかなり気に入っていることがわかる。
では、ホストにとっては解雇のチャンスとなるのでしょうか?おそらくシャオサもシャオサも同意しないでしょう。
AIニュース放送のトーンや表情の不安定さについては、まだ改善の余地がある。日本で非常に人気があったニュース放送ロボットは、現地のニュース産業を大規模に置き換えるものではなく、せいぜい補助的で目新しいものにすぎませんでした。
こうしてみると、確かにテクノロジーの進歩は斬新で素晴らしい体験をもたらしてくれますが、このような時代では現実よりもギミックの方が早く進んでしまうのかもしれません。
いつかその日が来るかもしれないが、それは決して今日ではない。その日が来れば、人類はすでにAIとどうやって付き合っていくかを見つけているかもしれないと信じるべきだ。その時期の春節では、AI が春節ガラを主催するだけでなく、AI のパフォーマンスも見られます。私たちは、AI が私たちに栄養を与えてくれるのを、ただ口を開けて待つことができます。
いつかその日が来るかもしれないが、それは決して今日ではない。その日が来れば、人類はすでにAIとどうやって付き合っていくかを見つけているかもしれないと信じるべきだ。その時期の春節では、AI が春節ガラを主催するだけでなく、AI のパフォーマンスも見られます。
私たちは、AI が私たちに栄養を与えてくれるのをただ口を開けて待つことができます。