Gemini Liveが進化:視覚認識・Googleアプリ連携でよりスマートな助っ人へ
Googleは、AIアシスタント「Gemini Live」の大幅な機能強化を発表した。同アシスタントは、ユーザーの日常を支える包括的なAIアシスタントを目指しており、世界を理解し、あらゆるタスクを支援し、自由なアイデアの探求を可能にするというビジョンを持つ。昨年発表されたGemini Liveは、Pixel 9シリーズと同時に登場し、自然で自由な会話体験を提供してきた。その後、多言語・多国対応の拡充、アプリ連携の拡大、カメラや画面共有による視覚的対話機能の追加を進めてきた。 今回のアップデートで、Gemini Liveはより視覚的に意識的になり、より表現力豊かで、Googleの主要アプリと深く統合された。特に注目すべきは、カメラを共有することで「見えるもの」をリアルタイムで共有し、Geminiが画面に直接ハイライトを表示する「オンスクリーン・ガイド」機能の導入だ。たとえば、家電の組み立て手順を確認する際、Geminiが実際に設置中の部品を画面に赤線で示すことで、ユーザーは直感的に理解できる。この機能は、Pixel 10シリーズの発売日(8月28日)から利用可能となり、その後の週に他のAndroid端末にも順次展開。iOS端末への対応も近日中に開始される予定だ。 また、Gemini LiveはGoogle Calendar、Keep、Tasksとの連携を強化。週間のスケジュールを話し合う中で、薬局の閉店前に処方箋の購入を忘れないよう、Google Tasksにリマインダーを自動設定できる。料理のレシピを考える際には、Google Keepにすべての材料を自動追加可能。さらに、今後はMessages、Phone、Clockアプリとの連携を追加。Google Mapsとの統合も拡充され、目的地までの最速経路を検索中に「10分遅れると伝える」など、状況に応じて即座にメッセージを送信する機能も可能になる。 たとえば、母親への誕生日プレゼントのアイデアをGeminiと相談している最中に「これだ! 父に連絡して、彼に買ってきてもらう」と言い換えれば、自動的に通話が開始される。移動中でも、経路の変更と相手への連絡を一連の会話で完結できる。こうした進化により、Gemini Liveは単なる回答型AIではなく、ユーザーの行動を自然に補完する「実用的かつ直感的なパートナー」へと進化している。