GoogleがGeminiアプリの音声ファイル対応を開始し、利用制限の詳細も明らかに。
Googleは10月21日、Geminiを搭載する複数の製品に大きなアップデートを実施した。主な変更点は3つ:Geminiアプリの音声ファイル対応、Google検索のAIモードによる5言語拡張、およびNotebookLMのレポート生成機能の拡充である。同社のGoogle Labs・Gemini担当バイスプレジデントであるジョシュ・ウッドワード氏はX(旧Twitter)上で、「音声ファイルのアップロード」がGeminiアプリに求められていた「1番目の要望」だったと明かし、ユーザーの声に応えたことを強調した。無料ユーザーは最大10分間の音声ファイルをアップロード可能で、1日5回のプロンプトが制限される。一方、AI ProおよびAI Ultraユーザーは最大3時間の音声を扱え、10ファイルまでさまざまな形式(ZIPファイル内も含む)を一度に処理できる。 また、Google検索のAIモードがGemini 2.5との統合により、ヒンディ語、インドネシア語、日本語、韓国語、ブラジルポルトガル語の5言語を追加サポート。これにより、世界中のユーザーが母国語で複雑な質問をAIに投げかけ、より深くウェブを探索できるようになった。Googleは「より多くの人々が、自分の言語でAIと対話できるようになる」と説明している。 NotebookLMも大幅に進化。ユーザーがアップロードした文書やメディアに基づき、80以上の言語で研究レポートを生成できるようになった。生成可能なフォーマットは、ブログ記事、学習ガイド、要約文書に加え、フラッシュカードやクイズも追加された。ユーザーはレポートの構成、トーン、スタイルをカスタマイズ可能で、AIが「自己作成形式」に応じて最適な出力を生成する。同機能は2024年10月下旬までに全ユーザーに提供される予定。 これらの進展は、Googleが過去1か月間で一気にAI機能を強化し、ユーザー体験を刷新していることを示している。8月にはGeminiが過去の会話からユーザーの好みを自動記憶する機能を導入。9月には無料ユーザーがWorkspaceの動画生成ツール「Vids」を無償利用可能に。さらにPhotosアプリはVeo 3を搭載し、静止画から4秒間の無音動画を作成できるようになった。 また、以前は利用制限が不明確だったが、GoogleはHelpセンターを更新し、各プランの明確な制限を公表。無料ユーザーは1日5回のプロンプト、5回のDeep Researchレポート、100枚のAI生成画像が上限。Proプランでは100回のプロンプト、1,000枚の画像が可能。Ultraプランは500回のプロンプト、1,000枚の画像を提供。これにより、ユーザーは利用状況を正確に把握できるようになった。 これらのアップデートは、GoogleがGeminiを中核に、AIを日常のツールとして普及させる戦略を加速している証左である。専門家からは「多言語対応とカスタマイズ機能の強化は、教育・研究分野での活用を促進する」との評価が寄せられている。今後、AIがよりパーソナライズされ、多様なニーズに応えるインフラとして定着する可能性が高まっている。