Meta、AI音声スタートアップWaveFormsを買収。Llamaの音声機能強化に向け、GPT-4o音声開発の中心人物を獲得。
Metaは、AI音声技術を専門とする若手スタートアップ「WaveForms」を買収した。この買収は、Metaが新設したAI部門「Superintelligence Labs」の強化を目的としており、先月にPlayAIを買収したことに続き、AI音声分野での戦略的強化を図る動きだ。WaveFormsは2024年12月に設立されたばかりの企業で、アンドリーセン・ホロウィッツ(a16z)が主導するシードラウンドで4000万ドルを調達し、前払い評価額は2億ドルに達していた。同社の開発目標は「音声図鑑テスト」の達成——つまり、AIが生成する音声が人間の声と区別できない状態を実現すること。さらに「感情的汎用知能(Emotional General Intelligence, EGI)」の実現を目指しており、音声のトーン、イントネーション、感情の変化をリアルタイムで読み取り、それに応じた適切な反応を示すAIの構築を進めている。 買収の中心人物である共同創業者アレクシス・コンネウは、Metaで音声研究に8年間従事した経験を持ち、OpenAI時代にはGPT-4oの高機能音声モードの開発を主導。彼は「端末から端末までの音声言語モデル」を構築しており、従来の音声処理パイプライン(音声→テキスト→応答→音声)を一つのモデルで統合する画期的なアプローチを実現。これにより、応答の自然さとリアルタイム性が飛躍的に向上する。もう一人の共同創業者コロリ・レメールは、グーグルで広告戦略を担当した経験を持つビジネスリーダー。両者がMetaに参加することで、技術開発と実用化の両面での強化が期待される。 Metaは、AI分野での人材獲得を積極的に進め、先日には元グーグル研究者であるヨハン・シャルクウィークを新設の音声技術部門の責任者に任命。WaveFormsのメンバーは彼に報告する体制となる。買収金額は非開示だが、2億ドルの評価額を踏まえると、数億ドル規模の買収と見られている。この動きは、Metaが自社開発のLlama 4モデルの音声機能がOpenAIに劣ると判断し、リリースを延期したことを背景にしている。WaveFormsの技術は、Meta AIの音声対話機能の質を飛躍的に向上させるとともに、Instagram Reelsの音声翻訳やメタバース内での感情豊かなAIキャラクター実装にも応用可能。マーケットの専門家は、「感情を理解する音声AIは、次世代のインタラクションの鍵になる」と評価しており、MetaのAI戦略における重要な一歩と注目されている。