HyperAIHyperAI

Command Palette

Search for a command to run...

Google TranslateがGemini音声モデルを搭載し、Android対応のあらゆるエアーバッドでリアルタイム音声翻訳を可能に。

Googleは、Gemini 2.5 Flash Native Audioのアップデートを発表し、リアルタイム音声対応のAIアシスタントとライブ音声翻訳機能を強化した。この新機能は、Google AI Studio、Vertex AIをはじめとする複数のGoogle製品に導入され、Gemini LiveやSearch Liveにも順次展開されている。これにより、ユーザーは自然な音声でGeminiと対話でき、リアルタイムのアイデア出しや検索支援が可能になる。特に、企業向けカスタマーサポートやローン処理などの業務プロセスにおいて、AIが人間と見分けがつかないほど自然な会話を行うことで、業務効率が飛躍的に向上している。ShopifyのDavid Wurtz氏は「ユーザーは1分も経たないうちにAIと話していることを忘れ、長時間の会話後に感謝の言葉を述べることも」と語り、Geminiの自然な音声がビジネス成果を生んでいると評価している。また、United Wholesale Mortgage(UWM)のJason Bressler氏は、Gemini 2.5 Flash Native Audioの導入により、2025年5月以降に1万4000件以上のローンが処理されたと報告。Newo.aiのDavid Yang氏も、音声認識の精度と感情表現の自然さが向上し、騒がしい環境でも会話の主語を正確に把握できると述べている。 さらに、Geminiはライブ音声翻訳機能を新たに搭載。この機能は、ヘッドフォンを使ってリアルタイムでスピーチを翻訳するもので、話者のトーン、ペース、抑揚を保持するという特徴を持つ。連続聴取モードでは、複数言語の会話が自動的に1つの目標言語に翻訳され、ユーザーは周囲の声を自分の言語で聞ける。二方向会話モードでは、話者の言語に応じて自動で出力言語を切り替え、英語話者がヒンディー語話者と会話する際、相手の発話はヒンディー語で、自分の発話は英語に翻訳されて聞こえる。この機能は、米国、メキシコ、インドのAndroidユーザーを対象にベータ版として提供中で、70以上の言語をサポート。2026年にはiOS版とより多くの国への展開が予定されている。 また、Google Translateアプリでは、Geminiの高度な自然言語処理能力を活用し、スラングや慣用句、地域表現など、文脈に応じた正確な翻訳が可能になる。たとえば「stealing my thunder」のような英語の慣用句も、直訳ではなく意味を正確に捉えて翻訳する。この機能は、米国とインドで英語と20言語(スペイン語、アラビア語、中国語、日本語、ドイツ語など)間で既に提供されている。さらに、言語学習ツールも拡充され、ドイツ、インド、スウェーデン、台湾など約20カ国で英語学習が可能に。発話練習のフィードバックや、連続学習日数の記録機能も追加され、Duolingoに近い体験が実現している。Googleは、AIと音声技術の進化を通じて、グローバルなコミュニケーションの障壁を大幅に低減する取り組みを加速している。

関連リンク