HyperAI超神経
Back to Headlines

OpenAI、ChatGPTの音声モードをアップデートし、より自然な会話を実現

12日前

主な要約 OpenAIが開発するチャットAI「ChatGPT」の音声機能が大幅アップデートを受けました。OpenAIは、「Advanced Voice」という音声対話機能をアップデートし、より自然で流れるような音声を実現しました。新機能により、ChatGPTの音声は「微細なイントネーション」「現実的な抑揚(包括的な休止や強調)」と「感情の正確な表現」が向上しました。これにより、共感や皮肉などの感情表現がよりリアルになり、人間との対話が自然に感じられます。 また、今回のアップデートでは翻訳機能も強化されました。ユーザーが簡単な命令を実行すると、ChatGPTはその言語での対話を自動的に翻訳し続けます。翻訳を止める場合や別の言語に切り替える場合は、指示するだけで簡単に対応できます。この翻訳機能は多言語間のコミュニケーションを容易にし、専門的な翻訳アプリケーションの需要を減らす可能性があります。 アップデートは全ての有料ChatGPTユーザー向けに行われ、さまざまな市場やプラットフォームで利用可能です。ただし、若干の音質低下や予期せぬ音調変動、音の乱れや背景音の問題が存在することが指摘されています。これらの課題に対し、OpenAIは今後の改善を目指しています。 背景の補足 ChatGPTの音声機能は、去年リリースされたGPT-4モデルに基づいています。このモデルはマルチモーダル対応であり、音声入力に対して迅速に反応することが可能で、最速232ミリ秒、平均320ミリ秒で返答することができます。今年初めにも小さなアップデートが行われ、音声の中断頻度の低減やアクセントの処理の改善が見られました。最新のアップデートでは、特に音声の品質と感情表現の精度が大きく向上し、AIによるコミュニケーションの幅が広がったと評価されています。 専門家たちは、今回のアップデートがAI音声アシスタントの進化に寄与すると考えています。AIが人間に近い自然な言葉遣いや感情表現を見せることで、ユーザー体験が向上し、より親しみやすく、信頼性のある対話が可能となると述べています。また、複言語対応の強化は、グローバルユーザーにとって大きなメリットとなるでしょう。 OpenAIは、これらの更新により、AI技術の普及を促進し、ユーザーベネフィットの最大化を追求しています。ただし、現時点で完全な無欠点という訳ではなく、予期せぬバグや問題の解決に向けて継続的な開発と改善が必要だと認識しています。これにより、将来的にはさらに完成度の高い音声アシスタントの実現が期待されます。

Related Links