HyperAI超神経

Googleは本日、開発者が創造的なアイデアをより迅速かつ低コストで実験し、反復し、拡張できるようにすることを目的とした2つの新しい生成AIモデルを発表した。そのうち、「Nano Banana」（Gemini画像モデル）ファミリーの最新メンバーであるGemini 3.1 Flash Lite Image（モデルID：gemini-3.1-flash-lite-image）は、高いスループットと極めて低いレイテンシが求められるシーン向けに設計されている。テキストから画像への変換にはわずか4秒かかり、解像度1Kの画像あたりのコストは最低$0.034となっている。プロンプトへの従順性、キャラクターの一貫性、および画像内の文字レンダリング品質を損なうことなく、大幅なスピード向上を実現している。公式には、以前Gemini 2.5 Flash Imageを使用していた開発者に全面的なパフォーマンス向上を得るため、直ちにこのモデルへ切り替えることを推奨している。本モデルはすでにGoogle AI Studio、Gemini API、そしてGemini Enterprise Agent Platformにて提供を開始しており、同時にSearchにおけるAIモード、Geminiアプリ、NotebookLM、Google Photosなどの消費者向け製品にも段階的に展開される予定だ。さらに、Google I/Oで初お披露目されたGemini Omni Flashも本日ついに開発者に向けて公開された（モデルID：gemini-omni-flash-preview）。料金は$0.10/秒で、Veo 3.1 Fastに対抗するものとなる。同モデルはテキスト、画像、動画の入力からの高品質な動画生成や自然言語による対話形式での編集をネイティブサポートしており、Geminiのマルチモーダル推論能力を活用して、歴史学、生物学、物語の論理といった文脈において論理的な動画コンテンツ構築を行うことができる。現在のところ単一出力の最大長さは10秒であり、それ以上の長時間化機能は今後間もなくリリースされる見込みだ。音声参照アップロードやシーンの拡張機能はまだAPIでは利用できない状態にある。 Gemini 3.1 Flash Lite Imageを用いて高速画像生成を行い、その後生成された画像をリファレンスとしてOmni Flashに渡すことでアニメーション処理を行えば、完全なエンドツーエンドのマルチモーダル体験が可能になる。またGoogleは同時にAnywhere（バーチャル・トラベル）、Space Lift（インテリアデザイン）、Omni Product Studio（EC動画製作）という3つのデモアプリケーションも併せて発表した。両モデルともSynthIDデジタル透かしによってコンテンツの透明性とコンプライアンス安全性を保証している。

関連リンク

関連リンク

関連リンク

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

Command Palette

Nano Banana 2 LiteとGemini Omni Flash公開

関連リンク

Command Palette

Nano Banana 2 LiteとGemini Omni Flash公開

関連リンク

Command Palette

Nano Banana 2 LiteとGemini Omni Flash公開

関連リンク

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。

絵文字で音声生成を制御できますか? Irodori-TTS は RF-DiT アーキテクチャに基づく日本語 TTS です。湿疹と白癬の皮膚疾患データセット: 医用画像分類と転移学習をサポートします。