AI音声モデルは将来的に商品化される――ElevenLabsCEOが長期展望を語る
AI音声企業「ElevenLabs」の共同創業者兼CEO、マティ・スタニゼフスキー氏は、AI音声モデルが将来的に「商品化(commoditized)」される可能性を示唆した。2025年8月に開催されたTechCrunch Disrupt会議のステージで、同氏はAI音声分野の短期的・長期的展望について語り、自社が現在注力するモデル開発の意義と、今後の戦略を明かした。 スタニゼフスキー氏は、自社の研究チームが音声モデルのアーキテクチャ課題の多くを克服したとし、今後1~2年間はこの分野の開発が継続すると述べた。しかし、長期的には「モデル間の差は小さくなり、商品化が進む」と予測。たとえ特定の声や言語で差が生じる可能性があるとしても、その差は徐々に縮小すると指摘した。 一方で、モデル開発を続ける理由について、彼は「現在の最大の競争優位性であり、技術的飛躍をもたらす唯一の手段」と説明。音声が自然に聞こえない場合、その問題を解決するには自社でモデルを構築するしかないと強調。また、信頼性とスケーラビリティを求める企業は、用途に応じて複数のモデルを活用する傾向が続くと見ている。 さらに、今後1~2年で、音声と動画、または音声と大規模言語モデル(LLM)を統合するマルチモーダルなアプローチが主流になると予測。GoogleのVeo 3が示すように、音声と映像の同時生成、会話型AIとの連携が可能になるという。ElevenLabsは、こうした分野で他社との提携やオープンソース技術の活用を検討。自社の音声技術と他分野の強みを融合させ、価値の最大化を目指す。 最終的に、スタニゼフスキー氏は「Appleがソフトウェアとハードウェアの統合で成功したように、AIと製品の融合が次世代の最良の使い方を生み出す」と結論づけた。モデル開発と実用応用の両輪を軸に、持続可能な価値創出をめざす戦略が明確に示された。
