HyperAI超神経
Back to Headlines

ジェミナイAI、写真を動画に変換する新機能登場

5日前

Googleが新しいAI機能Geminiを発表しました。これにより、写真を動画クリップに変換することが可能になります。この新機能はGoogleのVeo 3ビデオモデルによって推進されており、参照画像を8秒の動画に変換することができます。また、AI生成の音声(バックグラウンドノイズ、環境音、スピーチ)を含めることができます。 Geminniビデオ機能は、本日から一部地域のGoogle AI UltraおよびProのサブスクライバに提供開始されました。ウェブ版での提供から今週中には移動端末にも提供されます。ユーザーはプロンプトバーの「ツール」選択肢をクリックし、「ビデオ」を選び、写真をアップロードするだけで、自分の希望に合わせて写真を動画にすることができます。動画内の対話、効果音、周囲の雰囲気を説明する音声記述も含まれることが可能です。「音声は視覚と完全に同期します」とGoogleは述べています。最終的な動画は720pの解像度、16:9の横向きフォーマットでMP4ファイルとして提供されます。 さらに、「日々の物体をアニメーション化したり、描写や絵画を生き生きとさせたり、自然のシーンに動きを加えることができる」とGoogleは述べています。生成されるすべての動画には、AIによって生成されていることを示す可視のウォーターマークと不可視のSynthIDデジタルウォーターマークが含まれることも発表されました。類似した機能は既に三月に発売された、GoogleのAIシネマツール「Flow」で利用可能ですが、現在Geminiのユーザーはその他のアプリを開かずに自身の写真をアニメーションにすることができます。さらに、Flowも「今日追加で75の国」へと提供範囲が広がります。 この新機能は、Googleの安全への取り組みを示す一例でもあります。動画生成ツールを使用する際はユーザーが結果を信じられるように、システムのテストや潜在的な問題の発見と修正を積極的に行っています。また、これらのツールの利用方法や悪用防止策についての評価を行ない、違反コンテンツに対する方針の継続的な開発と取り組みを行っています。またユーザーからのフィードバックにも基づいた安全性の改善及び一般的な体験の向上に努めています。生成された全ての動画には、AI生成であることを示す可視及ぼび可視のウォーターマークが施されています。 Jess Weatherbedは、創造的産業、コンピューティング、インターネット文化に焦点を当てたニュースライターです。彼女はTechRadarでキャリアを始め、ニュースやハードウェアレビューを報じる活動を行いました。Geminiの新ビデオ機能はウェブサイト上でプロとUltraの購読者が使用可能で、またモバイルデバイスへの提供も進行中です。この機能により、毎日の物事をアニメ化したり、描画やペイントに命を与えたり、自然の風景に動きを加えることができます。 Googleの安全対策の一環として、彼らは「リッドチーム」と呼ばれる方法を使用して、自社のシステムに対する幅広いテストを行なっています。これは、問題が起こる前にそれを特定し修正することを目指しています。このシステムにおける潜在的なリスクを理解し未然に防ぐため、ツールがどのよう利用されうるのかの詳細な調査分析を行って安全上の配慮を講じています。Googleは常に安全でないコンテンツに対するガイドラインとポリシーを確立し、それを施行している。生成した動画にご満足いただければアップのサム指ボタンを、改善が必要だと感じたらダウンのサム指ボタンを使用してフィードバックすることができる。このフィードバックは安全性の改善や全体的な体験向上のために活用されます。この一連の発表と提供範囲の拡大は、GoogleがAI技術の進歩と安全性を両立しようとする意気込みを示しております。

Related Links