OpenAI、テキスト・音声で音楽を生成する新ツールを開発中
OpenAIがテキストや音声のプロンプトに基づいて音楽を生成する新ツールの開発を進めていることが、The Informationの報道で明らかになった。このツールは、既存の動画に音楽を追加したり、ボーカルトラックにギター伴奏を加えるといった用途に利用できるとされる。具体的な提供形態やリリース時期は未定であり、ChatGPTや動画生成AI「Sora」との統合か、独立した製品として提供されるかは不明だ。 複数の関係者によると、OpenAIはジュリアード音楽院の学生たちと協力し、楽譜データのラベル付けを通じてトレーニングデータを構築している。これは、音楽生成モデルが人間の音楽的感覚に近づくための重要な取り組みと見られている。 これまでOpenAIは音楽生成モデルを複数展開してきたが、いずれもChatGPTの登場以前のものである。近年はテキストから音声を生成するTTSや音声からテキストを変換するSTTといった音声モデルの開発に注力してきた。一方で、グーグルやSunoといった他社も生成音楽技術を展開しており、分野の競争は激しさを増している。 OpenAIはこの報道に対してコメントを控えているが、音楽生成という新たな分野での技術進展が、AIによるクリエイティブ支援の可能性をさらに広げる可能性がある。
